Kimi K2.7 Code

Model agentik open-source yang berfokus pada coding, dibangun untuk rekayasa perangkat lunak berdurasi panjang

8 menit baca2026-06-18
Kimi K2.7 Code

Apa itu Kimi K2.7 Code?

Kimi K2.7 Code adalah model agentik open-source yang berfokus pada coding, dikembangkan oleh Moonshot AI. Model ini menghadirkan performa coding dan agent yang lebih kuat, dengan peningkatan besar pada tugas coding nyata berdurasi panjang. Peningkatan tersebut menghasilkan tingkat keberhasilan tugas end-to-end yang lebih tinggi di berbagai workflow rekayasa perangkat lunak yang kompleks. K2.7 Code juga meningkatkan efisiensi penalaran, dengan mengurangi penggunaan thinking-token sekitar 30% dibandingkan K2.6.

Performa benchmark

Kimi K2.7 Code dievaluasi terhadap K2.6 menggunakan kombinasi benchmark internal dan eksternal yang mencakup dua dimensi: kemampuan coding dan eksekusi tugas agentik.

Perbandingan benchmark Kimi K2.7 Code, Kimi K2.6, GPT-5.5, dan Claude Opus 4.8 pada enam benchmark coding dan agentik

Pada benchmark coding, K2.7 Code menunjukkan peningkatan besar atas K2.6: +21,8% pada Kimi Code Bench v2 (62,0 vs 50,9), +11,0% pada Program Bench (53,6 vs 48,3), dan +31,5% pada MLS Bench Lite (35,1 vs 26,7).

Kemampuan coding yang lebih kuat juga berujung pada performa agentik yang lebih kuat. Pada Kimi Claw 24/7 Bench, MCP Atlas, dan MCP Mark Verified — benchmark yang mengukur eksekusi tugas agent otonom — K2.7 Code meningkat sekitar 10% dibandingkan K2.6.

  • Coding:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
Program Bench48.353.669.163.8
MLS Bench Lite26.735.135.542.8
  • Agentik:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Claw 24/7 Bench42.946.952.850.4
MCP Atlas69.476.079.481.3
MCP Mark Verified72.881.192.976.4

Kimi Code Bench v2 adalah benchmark internal yang dikembangkan oleh Moonshot AI, dan Kimi Claw 24/7 Bench adalah benchmark internal untuk evaluasi agentik. Kimi K2.7 Code dan K2.6 diuji melalui Kimi Code CLI dengan thinking aktif (temperature 1.0, top-p 0.95, konteks 262.144 token), sementara GPT-5.5 dievaluasi di Codex (xhigh) dan Opus 4.8 di Claude Code (xhigh). Pengecualian per benchmark dan metodologi lengkap dijelaskan dalam kartu model Hugging Face.

Dibangun untuk coding berdurasi panjang

Rekayasa perangkat lunak di dunia nyata jarang selesai dalam satu langkah. Tugas seperti refactoring codebase, menerapkan fitur di banyak file, atau debugging selama sesi agent yang panjang menuntut model untuk mengikuti instruksi secara andal di konteks yang luas, lalu menuntaskan tugas hingga selesai.

Kimi K2.7 Code dioptimalkan untuk skenario berdurasi panjang seperti ini. Dibandingkan K2.6, model ini lebih andal mengikuti instruksi dalam konteks panjang dan mencapai tingkat keberhasilan tugas end-to-end yang lebih tinggi, sehingga lebih cocok untuk workflow rekayasa perangkat lunak yang kompleks.

Efisiensi penalaran yang dioptimalkan

Model penalaran cenderung berpikir berlebihan, menghabiskan ribuan token untuk menimbang masalah yang sebenarnya tidak memerlukannya. Kimi K2.7 Code secara signifikan mengurangi kecenderungan ini: penggunaan thinking-token rata-rata turun sekitar 30% dibandingkan K2.6.

Di Kimi Code Bench v2, Program Bench, dan MLS Bench Lite, Kimi K2.7 Code meraih skor lebih tinggi daripada K2.6 sambil menggunakan lebih sedikit token pada setiap benchmark.

Performa vs Token Kimi K2.7 Code

Bagi developer, efisiensi ini terasa di setiap tugas: respons lebih cepat dalam sesi coding interaktif, biaya API lebih rendah di production, dan workflow agent yang mampu menyelesaikan lebih banyak pekerjaan dalam anggaran konteks yang sama.

Arsitektur model

Kimi K2.7 Code dibangun di atas arsitektur Mixture-of-Experts (MoE) dengan total 1 triliun parameter dan 32 miliar parameter aktif per token. Model ini mendukung panjang konteks 256K dan menggunakan Multi-head Latent Attention (MLA). Model ini juga menyertakan MoonViT, vision encoder 400 juta parameter.

ParameterNilai
ArsitekturMixture-of-Experts (MoE)
Total Parameter1T
Parameter Aktif32B
Jumlah Lapisan (termasuk lapisan Dense)61
Jumlah Lapisan Dense1
Dimensi Hidden Attention7168
Dimensi Hidden MoE (per Expert)2048
Jumlah Attention Head64
Jumlah Expert384
Expert Terpilih per Token8
Jumlah Expert Bersama1
Ukuran Vocabulary160K
Panjang Konteks256K
Mekanisme AttentionMLA
Fungsi AktivasiSwiGLU
Vision EncoderMoonViT
Parameter Vision Encoder400M

Bobot model lengkap bersifat open-source dan tersedia di Hugging Face.

Memilih antara Kimi K2.7 Code dan K2.6

Kimi K2.7 Code dirancang khusus untuk tugas coding. Untuk pekerjaan umum seperti menulis, analisis, dan percakapan, kami merekomendasikan K2.6 yang menawarkan kemampuan lebih menyeluruh.

Cara mengakses Kimi K2.7 Code

Tempat menggunakannya

Kimi K2.7 Code tersedia melalui:

  • Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code kini menjadi model default, dengan mode thinking aktif secara default. Untuk memulai, ikuti petunjuk penyiapan di halaman tersebut.

    antarmuka Kimi Code
  • Kimi API di open platform (https://platform.kimi.ai/). Developer dapat memanggil Kimi K2.7 Code melalui Kimi API dan mengintegrasikannya ke dalam workflow coding, agents, dan tool developer mereka sendiri.

Persyaratan mode thinking

Kimi K2.7 Code tidak mendukung mode non-thinking. Model ini selalu berjalan dengan thinking aktif, baik di Kimi API maupun Kimi Code. Di Kimi Code, permintaan yang dibuat dengan thinking dinonaktifkan akan otomatis dilayani oleh K2.6.

Harga Kimi K2.7 Code

Paket Kimi Code

Bagi pengguna yang ingin mencoba Kimi K2.7 Code langsung melalui Kimi Code, termasuk plugin terminal dan IDE, Anda dapat memilih paket Code kami. Harga di bawah ini adalah harga bulanan dengan penagihan tahunan:

PaketHargaCocok untuk
Moderato$15 / monthPengguna yang membutuhkan kuota penggunaan yang diperbarui mingguan dan akses multi-perangkat untuk workflow coding rutin
Allegretto$31 / monthPengguna mahir yang membutuhkan batas mingguan lebih besar dan batas konkurensi lebih tinggi
Allegro$79 / bulanPengguna yang mengerjakan tugas pengembangan intensif, proyek kompleks, dan beban kerja lebih besar
Vivace$159 / bulanPengguna yang membutuhkan kuota paket mingguan tertinggi untuk proyek kompleks dan codebase besar

Setiap paket mencakup batas penggunaan yang diperbarui mingguan. Paket tingkat lebih tinggi menyediakan batas mingguan lebih besar dan batas konkurensi lebih tinggi, sehingga cocok untuk proyek yang lebih kompleks.Untuk detail paket terbaru, lihat halaman keanggotaan resmi.

Harga Kimi API

Kimi K2.7 Code tersedia melalui Kimi API dengan penagihan berbasis penggunaan per token:

ModelUnitHarga Input (Cache Hit)Harga Input (Cache Miss)Harga OutputJendela Konteks
kimi-k2.7-code1M tokens$0.19$0.95$4.00262,144 tokens

API mendukung caching konteks otomatis, yang menurunkan biaya input untuk konteks yang digunakan kembali (cache hit $0.19 vs cache miss $0.95 per juta token). Harga belum termasuk pajak yang berlaku. Lihat dokumentasi harga resmi untuk tarif terbaru.

FAQ

Apakah Kimi K2.7 Code bersifat open-source?
Ya. Bobot modelnya bersifat open-source dan tersedia untuk diunduh di Hugging Face; di sana Anda juga dapat menemukan panduan deployment dan dokumentasi lengkap.
Berapa context window Kimi K2.7 Code?
Kimi K2.7 Code mendukung context window 256K (262.144 token), sehingga sangat cocok untuk codebase berskala repositori dan sesi coding multi-giliran yang panjang.
Apakah Kimi K2.7 Code mendukung input gambar dan video?
Ya. Kimi K2.7 Code menggunakan arsitektur multimodal native yang mendukung input teks, gambar, dan video, selain kemampuan coding dan agentiknya.
Apakah mode thinking wajib untuk menggunakan Kimi K2.7 Code?
Ya. Kimi K2.7 Code tidak mendukung mode non-thinking dan selalu berjalan dengan thinking aktif. Di Kimi Code, permintaan yang dibuat dengan thinking dinonaktifkan akan otomatis dilayani oleh K2.6.