Kimi K2.7 Code

Ein Open-Source-Agent-Modell mit Fokus auf Coding, entwickelt für langfristig angelegte Softwareentwicklung

8 Min. Lesezeit2026-06-18
Kimi K2.7 Code

Was ist Kimi K2.7 Code?

Kimi K2.7 Code ist ein Open-Source-Agent-Modell mit Coding-Schwerpunkt, entwickelt von Moonshot AI. Es bietet stärkere Coding- und Agent-Leistung sowie deutliche Verbesserungen bei realen, langfristig angelegten Coding-Aufgaben. Diese Fortschritte führen zu höheren End-to-End-Erfolgsraten in komplexen Workflows der Softwareentwicklung. Zudem verbessert K2.7 Code die Reasoning-Effizienz und reduziert den Verbrauch von Denk-tokens im Vergleich zu K2.6 um rund 30 %.

Benchmark-Leistung

Kimi K2.7 Code wurde auf einer Kombination interner und externer Benchmarks in zwei Dimensionen mit K2.6 verglichen: Coding-Fähigkeit und Agent-Aufgabenausführung.

Benchmark-Vergleich von Kimi K2.7 Code, Kimi K2.6, GPT-5.5 und Claude Opus 4.8 über sechs Coding- und Agent-Benchmarks hinweg

In Coding-Benchmarks erzielt K2.7 Code deutliche Zugewinne gegenüber K2.6: +21,8 % auf Kimi Code Bench v2 (62,0 vs. 50,9), +11,0 % auf Program Bench (53,6 vs. 48,3) und +31,5 % auf MLS Bench Lite (35,1 vs. 26,7).

Stärkere Coding-Fähigkeiten schlagen sich auch in einer höheren Agent-Leistung nieder. Auf Kimi Claw 24/7 Bench, MCP Atlas und MCP Mark Verified — Benchmarks zur Messung autonomer Agent-Aufgabenausführung — verbessert sich K2.7 Code gegenüber K2.6 um rund 10 %.

  • Coding:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
Program Bench48.353.669.163.8
MLS Bench Lite26.735.135.542.8
  • Agentisch:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Claw 24/7 Bench42.946.952.850.4
MCP Atlas69.476.079.481.3
MCP Mark Verified72.881.192.976.4

Kimi Code Bench v2 ist ein von Moonshot AI entwickelter interner Benchmark, und Kimi Claw 24/7 Bench ist ein interner Benchmark für Agent-Evaluierung. Kimi K2.7 Code und K2.6 wurden über Kimi Code CLI mit aktiviertem Denken getestet (temperature 1.0, top-p 0.95, 262.144-token-Kontext), während GPT-5.5 in Codex (xhigh) und Opus 4.8 in Claude Code (xhigh) evaluiert wurden. Ausnahmen je Benchmark und die vollständige Methodik sind in der Hugging Face model card beschrieben.

Für langfristig angelegte Coding-Aufgaben entwickelt

Reale Softwareentwicklung ist selten mit einem einzigen Schritt erledigt. Aufgaben wie das Refactoring einer Codebasis, die Implementierung eines Features über mehrere Dateien hinweg oder das Debugging in langen Agent-Sitzungen erfordern ein Modell, das Anweisungen über ausgedehnte Kontexte hinweg zuverlässig befolgt und Aufgaben bis zum Abschluss vorantreibt.

Kimi K2.7 Code ist für genau solche langfristig angelegten Szenarien optimiert. Gegenüber K2.6 folgt es Anweisungen in langen Kontexten zuverlässiger und erreicht höhere End-to-End-Erfolgsraten, wodurch es sich besser für komplexe Workflows in der Softwareentwicklung eignet.

Optimierte Reasoning-Effizienz

Reasoning-Modelle neigen dazu, zu viel nachzudenken und Tausende von tokens auf Probleme zu verwenden, die das gar nicht erfordern. Kimi K2.7 Code reduziert diese Tendenz deutlich: Im Vergleich zu K2.6 senkt es den Verbrauch von Denk-tokens im Durchschnitt um rund 30 %.

Über Kimi Code Bench v2, Program Bench und MLS Bench Lite hinweg erzielt Kimi K2.7 Code höhere Werte als K2.6 und verbraucht dabei in jedem Benchmark weniger tokens.

Leistung vs. tokens von Kimi K2.7 Code

Für Entwickler summiert sich diese Effizienz über jede Aufgabe hinweg: schnellere Antworten in interaktiven Coding-Sitzungen, geringere API-Kosten in der Produktion und Agent-Workflows, die im selben Kontextbudget mehr Arbeit abschließen.

Modellarchitektur

Kimi K2.7 Code basiert auf einer Mixture-of-Experts-(MoE)-Architektur mit insgesamt 1 Billion Parametern und 32 Milliarden aktivierten Parametern pro token. Das Modell unterstützt eine Kontextlänge von 256K und nutzt Multi-head Latent Attention (MLA). Außerdem enthält es MoonViT, einen Vision-Encoder mit 400M Parametern.

ParameterWert
ArchitekturMixture-of-Experts (MoE)
Gesamtparameter1T
Aktivierte Parameter32B
Anzahl der Schichten (inkl. Dense-Schicht)61
Anzahl der Dense-Schichten1
Verborgene Dimension der Attention7168
Verborgene MoE-Dimension (pro Expert)2048
Anzahl der Attention Heads64
Anzahl der Experts384
Ausgewählte Experts pro token8
Anzahl geteilter Experts1
Vokabulargröße160K
Kontextlänge256K
Attention-MechanismusMLA
AktivierungsfunktionSwiGLU
Vision-EncoderMoonViT
Parameter des Vision-Encoders400M

Die vollständigen Modellgewichte sind Open Source und auf Hugging Face verfügbar.

Auswahl zwischen Kimi K2.7 Code und K2.6

Kimi K2.7 Code ist gezielt für Coding-Aufgaben entwickelt. Für allgemeine Aufgaben wie Schreiben, Analyse und Gespräche empfehlen wir K2.6, das ausgewogenere Fähigkeiten bietet.

Zugriff auf Kimi K2.7 Code

Einsatzmöglichkeiten

Kimi K2.7 Code ist verfügbar über:

  • Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code ist jetzt das Standardmodell; der Denkmodus ist standardmäßig aktiviert. Befolgen Sie zum Einstieg die Einrichtungsanweisungen auf der Seite.

    Oberfläche von Kimi Code
  • Kimi API auf der offenen Plattform (https://platform.kimi.ai/). Entwickler können Kimi K2.7 Code über die Kimi API aufrufen und in ihre eigenen Coding-Workflows, agents und Entwicklertools integrieren.

Anforderung: Denkmodus

Kimi K2.7 Code unterstützt keinen Nicht-Denkmodus. Es läuft immer mit aktiviertem Denken, sowohl in der Kimi API als auch in Kimi Code. In Kimi Code werden Anfragen mit deaktiviertem Denken stattdessen automatisch von K2.6 bedient.

Preise für Kimi K2.7 Code

Kimi Code-Tarife

Wenn Sie Kimi K2.7 Code direkt über Kimi Code nutzen möchten, einschließlich Terminal- und IDE-Plugins, können Sie unsere Code-Tarife wählen. Die unten angegebenen Preise sind Monatspreise bei jährlicher Abrechnung:

TarifPreisGeeignet für
Moderato$15 / MonatNutzer, die wöchentlich erneuerte Nutzungskontingente und Zugriff über mehrere Geräte für regelmäßige Coding-Workflows benötigen
Allegretto$31 / MonatFortgeschrittene Nutzer, die höhere Wochenlimits und höhere Parallelitätsgrenzen benötigen
Allegro$79 / MonatNutzer mit intensiven Entwicklungsaufgaben, komplexen Projekten und größeren Workloads
Vivace$159 / MonatNutzer, die die höchsten wöchentlichen Tarifkontingente für komplexe Projekte und große Codebasen benötigen

Jeder Tarif enthält wöchentlich erneuerte Nutzungslimits. Höherstufige Tarife bieten größere Wochenlimits und höhere Parallelitätsgrenzen und eignen sich damit für komplexere Projekte.Die neuesten Tarifdetails finden Sie auf der offiziellen Mitgliedschaftsseite.

Preise der Kimi API

Kimi K2.7 Code ist über die Kimi API mit nutzungsbasierter Abrechnung pro token verfügbar:

ModellEinheitEingabepreis (Cache Hit)Eingabepreis (Cache Miss)AusgabepreisKontextfenster
kimi-k2.7-code1M tokens$0.19$0.95$4.00262,144 tokens

Die API unterstützt automatisches Kontext-Caching, wodurch sich die Eingabekosten für wiederverwendeten Kontext verringern (Cache Hit $0.19 gegenüber Cache Miss $0.95 pro Million tokens). Preise verstehen sich zuzüglich anfallender Steuern. Die aktuellen Preise finden Sie in der offiziellen Preisdokumentation.

FAQ

Ist Kimi K2.7 Code Open Source?
Ja. Die Modellgewichte sind Open Source und auf Hugging Face zum Download verfügbar; dort finden Sie auch Bereitstellungsanleitungen und die vollständige Dokumentation.
Wie groß ist das Kontextfenster von Kimi K2.7 Code?
Kimi K2.7 Code unterstützt ein Kontextfenster von 256K (262.144 tokens) und eignet sich damit besonders für Codebasen auf Repository-Ebene sowie lange Coding-Sitzungen über mehrere Dialogrunden hinweg.
Unterstützt Kimi K2.7 Code Bild- und Videoeingaben?
Ja. Kimi K2.7 Code nutzt eine nativ multimodale Architektur, die neben Coding- und Agent-Funktionen auch Text-, Bild- und Videoeingaben unterstützt.
Ist der Denkmodus für die Nutzung von Kimi K2.7 Code erforderlich?
Ja. Kimi K2.7 Code unterstützt keinen Modus ohne Denken und läuft immer mit aktiviertem Denken. In Kimi Code werden Anfragen mit deaktiviertem Denken stattdessen automatisch von K2.6 verarbeitet.