Kimi K2.7 Code 是什麼?
Kimi K2.7 Code 是 Moonshot AI 開發的一款開源、聚焦程式開發的 agentic 模型。它帶來更強的程式開發與 agent 表現,並在真實世界的長週期程式開發任務上大幅提升。這些進展讓複雜軟體工程流程中的端到端任務成功率更高。K2.7 Code 也提升了推理效率,相較 K2.6,思考 token 用量約降低 30%。
基準測試表現
我們以涵蓋兩個面向的內部與外部基準測試,將 Kimi K2.7 Code 與 K2.6 進行比較:程式開發能力與 agentic 任務執行。
在程式開發基準測試中,K2.7 Code 相較 K2.6 有顯著提升:Kimi Code Bench v2 +21.8%(62.0 對 50.9)、Program Bench +11.0%(53.6 對 48.3),以及 MLS Bench Lite +31.5%(35.1 對 26.7)。
更強的程式開發能力,也會轉化為更出色的 agentic 表現。在衡量自主 agent 任務執行的 Kimi Claw 24/7 Bench、MCP Atlas 與 MCP Mark Verified 上,K2.7 Code 相較 K2.6 約提升 10%。
程式開發:
| 基準測試 | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentic:
| 基準測試 | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
Kimi Code Bench v2 是 Moonshot AI 開發的內部基準測試,Kimi Claw 24/7 Bench 則是用於 agentic 評估的內部基準測試。Kimi K2.7 Code 與 K2.6 透過啟用思考的 Kimi Code CLI 進行測試(temperature 1.0、top-p 0.95、262,144-token 上下文),GPT-5.5 以 Codex(xhigh)評估,Opus 4.8 則以 Claude Code(xhigh)評估。各基準測試的例外設定與完整方法詳見 Hugging Face model card。
專為長週期程式開發打造
真實世界的軟體工程很少一步到位。無論是重構程式碼庫、跨多個檔案實作功能,或是在長時間的 agent 工作階段中除錯,都需要模型能在延伸上下文中可靠遵循指令,並把任務推進到完成。
Kimi K2.7 Code 正是針對這類長週期情境最佳化。相較 K2.6,它在長上下文中更能穩定遵循指令,端到端任務成功率也更高,因此更適合複雜的軟體工程流程。
最佳化推理效率
推理模型往往會過度思考,為不需要如此費力的問題耗費數千個 tokens 反覆斟酌。Kimi K2.7 Code 大幅降低了這種傾向:相較 K2.6,平均可減少約 30% 的思考 token 用量。
在 Kimi Code Bench v2、Program Bench 與 MLS Bench Lite 中,Kimi K2.7 Code 各項分數都高於 K2.6,同時在每項基準測試上消耗更少 tokens。
對開發者而言,這份效率會在每個任務中累積成效:互動式程式開發工作階段回應更快、生產環境 API 成本更低,agent 工作流程也能在相同上下文預算內完成更多工作。
模型架構
Kimi K2.7 Code 採用 Mixture-of-Experts(MoE)架構,總參數量為 1 兆,每個 token 啟用 320 億參數。模型支援 256K 上下文長度,並使用 Multi-head Latent Attention(MLA)。此外也內建 MoonViT,這是一個 4 億參數的視覺編碼器。
| 參數 | 數值 |
|---|---|
| 架構 | Mixture-of-Experts (MoE) |
| 總參數量 | 1T |
| 啟用參數量 | 32B |
| 層數(含 Dense layer) | 61 |
| Dense Layers 數量 | 1 |
| Attention 隱藏維度 | 7168 |
| MoE 隱藏維度(每個 Expert) | 2048 |
| Attention Heads 數量 | 64 |
| Experts 數量 | 384 |
| 每個 Token 選取的 Experts 數量 | 8 |
| Shared Experts 數量 | 1 |
| 詞彙表大小 | 160K |
| 上下文長度 | 256K |
| Attention 機制 | MLA |
| Activation Function | SwiGLU |
| Vision Encoder | MoonViT |
| Vision Encoder 參數量 | 400M |
完整模型權重已開源,並可在 Hugging Face 取得。
如何選擇 Kimi K2.7 Code 與 K2.6
Kimi K2.7 Code 專為程式開發任務打造。若是寫作、分析與對話等通用工作,我們建議使用 K2.6;它的能力更均衡全面。
如何使用 Kimi K2.7 Code
可使用的平台
Kimi K2.7 Code 可透過以下方式使用:
Kimi Code (https://www.kimi.com/code)。Kimi K2.7 Code 現已成為預設模型,並預設啟用思考模式。若要開始使用,請依照頁面上的設定說明操作。
開放平台上的 Kimi API (https://platform.kimi.ai/)。開發者可透過 Kimi API 呼叫 Kimi K2.7 Code,並將其整合到自己的程式開發流程、agents 與開發者工具中。
思考模式要求
Kimi K2.7 Code 不支援非思考模式。無論在 Kimi API 或 Kimi Code 中,它一律以啟用思考的狀態執行。在 Kimi Code 中,若請求關閉思考,系統會自動改由 K2.6 提供服務。
Kimi K2.7 Code 定價
Kimi Code 方案
若你想直接透過 Kimi Code 體驗 Kimi K2.7 Code,包括終端機與 IDE 外掛,可選擇我們的 Code 方案。以下價格為年繳方案下的月費:
| 方案 | 價格 | 最適合 |
|---|---|---|
| Moderato | $15 / 月 | 需要每週更新使用額度與多裝置存取,以支援日常程式開發流程的使用者 |
| Allegretto | $31 / 月 | 需要更高每週額度與更大並行上限的進階使用者 |
| Allegro | $79 / 月 | 處理高強度開發任務、複雜專案與較大工作量的使用者 |
| Vivace | $159 / 月 | 需要最高每週方案額度,以應對複雜專案與大型程式碼庫的使用者 |
每個方案都包含每週更新的使用上限. 較高階方案提供更大的每週額度與更高並行上限,適合更複雜的專案.如需最新方案詳情,請參閱官方會員頁面。
Kimi API 定價
Kimi K2.7 Code 可透過 Kimi API 使用,採用按 token 用量計費:
| 模型 | 單位 | 輸入價格(快取命中) | 輸入價格(快取未命中) | 輸出價格 | 上下文視窗 |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M tokens | $0.19 | $0.95 | $4.00 | 262,144 tokens |
API 支援自動上下文快取,可降低重複使用上下文的輸入成本(快取命中每百萬 tokens $0.19,快取未命中 $0.95)。價格不含適用稅費。如需最新費率,請參閱官方定價文件。