Was ist Kimi K2.7 Code?
Kimi K2.7 Code ist ein Open-Source-Agent-Modell mit Coding-Schwerpunkt, entwickelt von Moonshot AI. Es bietet stärkere Coding- und Agent-Leistung sowie deutliche Verbesserungen bei realen, langfristig angelegten Coding-Aufgaben. Diese Fortschritte führen zu höheren End-to-End-Erfolgsraten in komplexen Workflows der Softwareentwicklung. Zudem verbessert K2.7 Code die Reasoning-Effizienz und reduziert den Verbrauch von Denk-tokens im Vergleich zu K2.6 um rund 30 %.
Benchmark-Leistung
Kimi K2.7 Code wurde auf einer Kombination interner und externer Benchmarks in zwei Dimensionen mit K2.6 verglichen: Coding-Fähigkeit und Agent-Aufgabenausführung.
In Coding-Benchmarks erzielt K2.7 Code deutliche Zugewinne gegenüber K2.6: +21,8 % auf Kimi Code Bench v2 (62,0 vs. 50,9), +11,0 % auf Program Bench (53,6 vs. 48,3) und +31,5 % auf MLS Bench Lite (35,1 vs. 26,7).
Stärkere Coding-Fähigkeiten schlagen sich auch in einer höheren Agent-Leistung nieder. Auf Kimi Claw 24/7 Bench, MCP Atlas und MCP Mark Verified — Benchmarks zur Messung autonomer Agent-Aufgabenausführung — verbessert sich K2.7 Code gegenüber K2.6 um rund 10 %.
Coding:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentisch:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
Kimi Code Bench v2 ist ein von Moonshot AI entwickelter interner Benchmark, und Kimi Claw 24/7 Bench ist ein interner Benchmark für Agent-Evaluierung. Kimi K2.7 Code und K2.6 wurden über Kimi Code CLI mit aktiviertem Denken getestet (temperature 1.0, top-p 0.95, 262.144-token-Kontext), während GPT-5.5 in Codex (xhigh) und Opus 4.8 in Claude Code (xhigh) evaluiert wurden. Ausnahmen je Benchmark und die vollständige Methodik sind in der Hugging Face model card beschrieben.
Für langfristig angelegte Coding-Aufgaben entwickelt
Reale Softwareentwicklung ist selten mit einem einzigen Schritt erledigt. Aufgaben wie das Refactoring einer Codebasis, die Implementierung eines Features über mehrere Dateien hinweg oder das Debugging in langen Agent-Sitzungen erfordern ein Modell, das Anweisungen über ausgedehnte Kontexte hinweg zuverlässig befolgt und Aufgaben bis zum Abschluss vorantreibt.
Kimi K2.7 Code ist für genau solche langfristig angelegten Szenarien optimiert. Gegenüber K2.6 folgt es Anweisungen in langen Kontexten zuverlässiger und erreicht höhere End-to-End-Erfolgsraten, wodurch es sich besser für komplexe Workflows in der Softwareentwicklung eignet.
Optimierte Reasoning-Effizienz
Reasoning-Modelle neigen dazu, zu viel nachzudenken und Tausende von tokens auf Probleme zu verwenden, die das gar nicht erfordern. Kimi K2.7 Code reduziert diese Tendenz deutlich: Im Vergleich zu K2.6 senkt es den Verbrauch von Denk-tokens im Durchschnitt um rund 30 %.
Über Kimi Code Bench v2, Program Bench und MLS Bench Lite hinweg erzielt Kimi K2.7 Code höhere Werte als K2.6 und verbraucht dabei in jedem Benchmark weniger tokens.
Für Entwickler summiert sich diese Effizienz über jede Aufgabe hinweg: schnellere Antworten in interaktiven Coding-Sitzungen, geringere API-Kosten in der Produktion und Agent-Workflows, die im selben Kontextbudget mehr Arbeit abschließen.
Modellarchitektur
Kimi K2.7 Code basiert auf einer Mixture-of-Experts-(MoE)-Architektur mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern pro token. Das Modell unterstützt eine Kontextlänge von 256K und nutzt Multi-head Latent Attention (MLA). Außerdem enthält es MoonViT, einen Vision-Encoder mit 400M Parametern.
| Parameter | Wert |
|---|---|
| Architektur | Mixture-of-Experts (MoE) |
| Gesamtparameter | 1T |
| Aktivierte Parameter | 32B |
| Anzahl der Schichten (inkl. Dense-Schicht) | 61 |
| Anzahl der Dense-Schichten | 1 |
| Verborgene Dimension der Attention | 7168 |
| Verborgene MoE-Dimension (pro Expert) | 2048 |
| Anzahl der Attention Heads | 64 |
| Anzahl der Experts | 384 |
| Ausgewählte Experts pro token | 8 |
| Anzahl geteilter Experts | 1 |
| Vokabulargröße | 160K |
| Kontextlänge | 256K |
| Attention-Mechanismus | MLA |
| Aktivierungsfunktion | SwiGLU |
| Vision-Encoder | MoonViT |
| Parameter des Vision-Encoders | 400M |
Die vollständigen Modellgewichte sind Open Source und auf Hugging Face verfügbar.
Auswahl zwischen Kimi K2.7 Code und K2.6
Kimi K2.7 Code ist gezielt für Coding-Aufgaben entwickelt. Für allgemeine Aufgaben wie Schreiben, Analyse und Gespräche empfehlen wir K2.6, das ausgewogenere Fähigkeiten bietet.
Zugriff auf Kimi K2.7 Code
Einsatzmöglichkeiten
Kimi K2.7 Code ist verfügbar über:
Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code ist jetzt das Standardmodell; der Denkmodus ist standardmäßig aktiviert. Befolgen Sie zum Einstieg die Einrichtungsanweisungen auf der Seite.
Kimi API auf der offenen Plattform (https://platform.kimi.ai/). Entwickler können Kimi K2.7 Code über die Kimi API aufrufen und in ihre eigenen Coding-Workflows, agents und Entwicklertools integrieren.
Anforderung: Denkmodus
Kimi K2.7 Code unterstützt keinen Nicht-Denkmodus. Es läuft immer mit aktiviertem Denken, sowohl in der Kimi API als auch in Kimi Code. In Kimi Code werden Anfragen mit deaktiviertem Denken stattdessen automatisch von K2.6 bedient.
Preise für Kimi K2.7 Code
Kimi Code-Tarife
Wenn Sie Kimi K2.7 Code direkt über Kimi Code nutzen möchten, einschließlich Terminal- und IDE-Plugins, können Sie unsere Code-Tarife wählen. Die unten angegebenen Preise sind Monatspreise bei jährlicher Abrechnung:
| Tarif | Preis | Geeignet für |
|---|---|---|
| Moderato | $15 / Monat | Nutzer, die wöchentlich erneuerte Nutzungskontingente und Zugriff über mehrere Geräte für regelmäßige Coding-Workflows benötigen |
| Allegretto | $31 / Monat | Fortgeschrittene Nutzer, die höhere Wochenlimits und höhere Parallelitätsgrenzen benötigen |
| Allegro | $79 / Monat | Nutzer mit intensiven Entwicklungsaufgaben, komplexen Projekten und größeren Workloads |
| Vivace | $159 / Monat | Nutzer, die die höchsten wöchentlichen Tarifkontingente für komplexe Projekte und große Codebasen benötigen |
Jeder Tarif enthält wöchentlich erneuerte Nutzungslimits. Höherstufige Tarife bieten größere Wochenlimits und höhere Parallelitätsgrenzen und eignen sich damit für komplexere Projekte.Die neuesten Tarifdetails finden Sie auf der offiziellen Mitgliedschaftsseite.
Preise der Kimi API
Kimi K2.7 Code ist über die Kimi API mit nutzungsbasierter Abrechnung pro token verfügbar:
| Modell | Einheit | Eingabepreis (Cache Hit) | Eingabepreis (Cache Miss) | Ausgabepreis | Kontextfenster |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M tokens | $0.19 | $0.95 | $4.00 | 262,144 tokens |
Die API unterstützt automatisches Kontext-Caching, wodurch sich die Eingabekosten für wiederverwendeten Kontext verringern (Cache Hit $0.19 gegenüber Cache Miss $0.95 pro Million tokens). Preise verstehen sich zuzüglich anfallender Steuern. Die aktuellen Preise finden Sie in der offiziellen Preisdokumentation.