Kimi K2.7 Code

Model agentik open-source yang berfokus pada coding, dibangun untuk rekayasa perangkat lunak berdurasi panjang

8 menit baca2026-06-18

Apa itu Kimi K2.7 Code?

Kimi K2.7 Code adalah model agentik open-source yang berfokus pada coding, dikembangkan oleh Moonshot AI. Model ini menghadirkan performa coding dan agent yang lebih kuat, dengan peningkatan besar pada tugas coding nyata berdurasi panjang. Peningkatan tersebut menghasilkan tingkat keberhasilan tugas end-to-end yang lebih tinggi di berbagai workflow rekayasa perangkat lunak yang kompleks. K2.7 Code juga meningkatkan efisiensi penalaran, dengan mengurangi penggunaan thinking-token sekitar 30% dibandingkan K2.6.

Performa benchmark

Kimi K2.7 Code dievaluasi terhadap K2.6 menggunakan kombinasi benchmark internal dan eksternal yang mencakup dua dimensi: kemampuan coding dan eksekusi tugas agentik.

Perbandingan benchmark Kimi K2.7 Code, Kimi K2.6, GPT-5.5, dan Claude Opus 4.8 pada enam benchmark coding dan agentik

Pada benchmark coding, K2.7 Code menunjukkan peningkatan besar atas K2.6: +21,8% pada Kimi Code Bench v2 (62,0 vs 50,9), +11,0% pada Program Bench (53,6 vs 48,3), dan +31,5% pada MLS Bench Lite (35,1 vs 26,7).

Kemampuan coding yang lebih kuat juga berujung pada performa agentik yang lebih kuat. Pada Kimi Claw 24/7 Bench, MCP Atlas, dan MCP Mark Verified — benchmark yang mengukur eksekusi tugas agent otonom — K2.7 Code meningkat sekitar 10% dibandingkan K2.6.

Coding:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentik:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

Kimi Code Bench v2 adalah benchmark internal yang dikembangkan oleh Moonshot AI, dan Kimi Claw 24/7 Bench adalah benchmark internal untuk evaluasi agentik. Kimi K2.7 Code dan K2.6 diuji melalui Kimi Code CLI dengan thinking aktif (temperature 1.0, top-p 0.95, konteks 262.144 token), sementara GPT-5.5 dievaluasi di Codex (xhigh) dan Opus 4.8 di Claude Code (xhigh). Pengecualian per benchmark dan metodologi lengkap dijelaskan dalam kartu model Hugging Face.

Dibangun untuk coding berdurasi panjang

Rekayasa perangkat lunak di dunia nyata jarang selesai dalam satu langkah. Tugas seperti refactoring codebase, menerapkan fitur di banyak file, atau debugging selama sesi agent yang panjang menuntut model untuk mengikuti instruksi secara andal di konteks yang luas, lalu menuntaskan tugas hingga selesai.

Kimi K2.7 Code dioptimalkan untuk skenario berdurasi panjang seperti ini. Dibandingkan K2.6, model ini lebih andal mengikuti instruksi dalam konteks panjang dan mencapai tingkat keberhasilan tugas end-to-end yang lebih tinggi, sehingga lebih cocok untuk workflow rekayasa perangkat lunak yang kompleks.

Coba di Kimi Code

Efisiensi penalaran yang dioptimalkan

Model penalaran cenderung berpikir berlebihan, menghabiskan ribuan token untuk menimbang masalah yang sebenarnya tidak memerlukannya. Kimi K2.7 Code secara signifikan mengurangi kecenderungan ini: penggunaan thinking-token rata-rata turun sekitar 30% dibandingkan K2.6.

Di Kimi Code Bench v2, Program Bench, dan MLS Bench Lite, Kimi K2.7 Code meraih skor lebih tinggi daripada K2.6 sambil menggunakan lebih sedikit token pada setiap benchmark.

Bagi developer, efisiensi ini terasa di setiap tugas: respons lebih cepat dalam sesi coding interaktif, biaya API lebih rendah di production, dan workflow agent yang mampu menyelesaikan lebih banyak pekerjaan dalam anggaran konteks yang sama.

Coba di Kimi Code

Arsitektur model

Kimi K2.7 Code dibangun di atas arsitektur Mixture-of-Experts (MoE) dengan total 1 triliun parameter dan 32 miliar parameter aktif per token. Model ini mendukung panjang konteks 256K dan menggunakan Multi-head Latent Attention (MLA). Model ini juga menyertakan MoonViT, vision encoder 400 juta parameter.

Parameter	Nilai
Arsitektur	Mixture-of-Experts (MoE)
Total Parameter	1T
Parameter Aktif	32B
Jumlah Lapisan (termasuk lapisan Dense)	61
Jumlah Lapisan Dense	1
Dimensi Hidden Attention	7168
Dimensi Hidden MoE (per Expert)	2048
Jumlah Attention Head	64
Jumlah Expert	384
Expert Terpilih per Token	8
Jumlah Expert Bersama	1
Ukuran Vocabulary	160K
Panjang Konteks	256K
Mekanisme Attention	MLA
Fungsi Aktivasi	SwiGLU
Vision Encoder	MoonViT
Parameter Vision Encoder	400M

Bobot model lengkap bersifat open-source dan tersedia di Hugging Face.

Memilih antara Kimi K2.7 Code dan K2.6

Kimi K2.7 Code dirancang khusus untuk tugas coding. Untuk pekerjaan umum seperti menulis, analisis, dan percakapan, kami merekomendasikan K2.6 yang menawarkan kemampuan lebih menyeluruh.

Cara mengakses Kimi K2.7 Code

Tempat menggunakannya

Kimi K2.7 Code tersedia melalui:

Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code kini menjadi model default, dengan mode thinking aktif secara default. Untuk memulai, ikuti petunjuk penyiapan di halaman tersebut.
Kimi API di open platform (https://platform.kimi.ai/). Developer dapat memanggil Kimi K2.7 Code melalui Kimi API dan mengintegrasikannya ke dalam workflow coding, agents, dan tool developer mereka sendiri.

Persyaratan mode thinking

Kimi K2.7 Code tidak mendukung mode non-thinking. Model ini selalu berjalan dengan thinking aktif, baik di Kimi API maupun Kimi Code. Di Kimi Code, permintaan yang dibuat dengan thinking dinonaktifkan akan otomatis dilayani oleh K2.6.

Harga Kimi K2.7 Code

Paket Kimi Code

Bagi pengguna yang ingin mencoba Kimi K2.7 Code langsung melalui Kimi Code, termasuk plugin terminal dan IDE, Anda dapat memilih paket Code kami. Harga di bawah ini adalah harga bulanan dengan penagihan tahunan:

Paket	Harga	Cocok untuk
Moderato	$15 / month	Pengguna yang membutuhkan kuota penggunaan yang diperbarui mingguan dan akses multi-perangkat untuk workflow coding rutin
Allegretto	$31 / month	Pengguna mahir yang membutuhkan batas mingguan lebih besar dan batas konkurensi lebih tinggi
Allegro	$79 / bulan	Pengguna yang mengerjakan tugas pengembangan intensif, proyek kompleks, dan beban kerja lebih besar
Vivace	$159 / bulan	Pengguna yang membutuhkan kuota paket mingguan tertinggi untuk proyek kompleks dan codebase besar

Setiap paket mencakup batas penggunaan yang diperbarui mingguan. Paket tingkat lebih tinggi menyediakan batas mingguan lebih besar dan batas konkurensi lebih tinggi, sehingga cocok untuk proyek yang lebih kompleks.Untuk detail paket terbaru, lihat halaman keanggotaan resmi.

Harga Kimi API

Kimi K2.7 Code tersedia melalui Kimi API dengan penagihan berbasis penggunaan per token:

Model	Unit	Harga Input (Cache Hit)	Harga Input (Cache Miss)	Harga Output	Jendela Konteks
kimi-k2.7-code	1M tokens	$0.19	$0.95	$4.00	262,144 tokens

API mendukung caching konteks otomatis, yang menurunkan biaya input untuk konteks yang digunakan kembali (cache hit $0.19 vs cache miss $0.95 per juta token). Harga belum termasuk pajak yang berlaku. Lihat dokumentasi harga resmi untuk tarif terbaru.

FAQ

Apakah Kimi K2.7 Code bersifat open-source?

Ya. Bobot modelnya bersifat open-source dan tersedia untuk diunduh di Hugging Face; di sana Anda juga dapat menemukan panduan deployment dan dokumentasi lengkap.

Berapa context window Kimi K2.7 Code?

Kimi K2.7 Code mendukung context window 256K (262.144 token), sehingga sangat cocok untuk codebase berskala repositori dan sesi coding multi-giliran yang panjang.

Apakah Kimi K2.7 Code mendukung input gambar dan video?

Ya. Kimi K2.7 Code menggunakan arsitektur multimodal native yang mendukung input teks, gambar, dan video, selain kemampuan coding dan agentiknya.

Apakah mode thinking wajib untuk menggunakan Kimi K2.7 Code?

Ya. Kimi K2.7 Code tidak mendukung mode non-thinking dan selalu berjalan dengan thinking aktif. Di Kimi Code, permintaan yang dibuat dengan thinking dinonaktifkan akan otomatis dilayani oleh K2.6.