Preise für Kimi K2.7 Code erklärt: API-Kosten und Tarife

8 Min. Lesezeit2026-06-25
Preise der Kimi K2.7 Code API

Kimi K2.7 Code-Mitgliedschaftstarife & Nutzungsstufen

Wenn Sie Kimi K2.7 Code direkt in Ihrem Terminal oder Ihrer IDE verwenden möchten, ist ein Kimi Code-Abonnement der einfachste Weg.

ModeratoAllegrettoAllegroVivace
Monatspreis$19 / Monat$39 / Monat$99 / Monat$199 / Monat
BeschreibungWöchentlich aufgefrischte Nutzungskontingente mit Anmeldung auf mehreren Geräten, sodass Sie Ihren Tarif geräteübergreifend nutzen und effizient an mehreren Projekten arbeiten könnenGroßzügige Wochenlimits und höhere Parallelitätsgrenzen – eine besonders attraktive Lösung für fortgeschrittene NutzerUmfangreiches Kontingent für höchste Ansprüche. Bewältigt nahtlos alles von täglichen Aufgaben bis zu intensiver EntwicklungUnsere höchsten wöchentlichen Tarifkontingente, mit denen Sie komplexe Projekte und große Codebases mühelos bewältigen

Jeder Tarif enthält wöchentlich aufgefrischte Nutzungskontingente. Höhere Stufen bieten größere Wochenlimits und höhere Parallelitätsgrenzen und eignen sich damit für anspruchsvollere Projekte. Die neuesten Tarifdetails finden Sie auf der offiziellen Mitgliedschaftsseite.

Was ist über Kimi Code hinaus enthalten?

Mit dem Kauf eines beliebigen Kimi Code-Tarifs werden auch die umfassenderen Vorteile der Kimi-Mitgliedschaft freigeschaltet, die hauptsächlich von Kimi K2.6 unterstützt werden.

AdagioModeratoAllegrettoAllegroVivace
Preis$0$19 / Monat$39 / Monat$99 / Monat$199 / Monat
Agent-Nutzung660150360720
Gleichzeitige Agent-Aufgaben1 Aufgabe2 Aufgaben2 Aufgaben4 Aufgaben4 Aufgaben
Agent-Prioritätswarteschlange4x Geschwindigkeit4x Geschwindigkeit4x Geschwindigkeit4x Geschwindigkeit
Agent Swarm25 Nutzungen enthalten50 Nutzungen enthalten120 Nutzungen enthalten240 Nutzungen enthalten
Gleichzeitige Subagents in Agent Swarm2 Subagents4 Subagents4 Subagents8 Subagents
Kimi Claw
Kimi Claw Android
Kimi Claw PC
Gruppenchat mit Claw10 Gruppenchats10 Gruppenchats10 Gruppenchats
Website mit Datenbank bereitstellen
Aktive geplante Aufgaben in Kimi Work2 Aufgaben10 Aufgaben15 Aufgaben20 Aufgaben20 Aufgaben

Diese produktübergreifenden Vorteile stehen in allen kostenpflichtigen Tarifen zusätzlich zu deiner Kimi K2.7 Code-Nutzung zur Verfügung – damit erhältst du in einem Abo sowohl einen spezialisierten Coding-Agent als auch einen vollständigen AI-Workspace.

Preise der Kimi K2.7 Code API

Die Preise der Kimi K2.7 Code API basieren auf einem token-basierten Modell: Sowohl Eingabe- als auch Ausgabeverarbeitung werden pro 1M Tokens (1.000.000 Tokens) abgerechnet. So bleiben die Kosten klar und gut planbar.

ModellEinheitEingabepreis (Cache-Treffer)Eingabepreis (Cache-Fehlschlag)AusgabepreisKontextfenster
kimi-k2.7-code1M Tokens$0.19$0.95$4.00262,144 Tokens
kimi-k2.7-code-highspeed1M Tokens$0.38$1.90$8.00262,144 Tokens

Das Standardmodell kimi-k2.7-code bietet Kimis leistungsfähigste Coding-Intelligenz und unterstützt Long-Context-Reasoning sowie agentische Aufgaben vollständig. Die Variante kimi-k2.7-code-highspeed erreicht eine Ausgabegeschwindigkeit von etwa 180 Tokens/s (bis zu 260 Tokens/s bei kurzen Kontexten) und sorgt damit für ein besonders schnelles Coding-Erlebnis in latenzsensiblen Workflows.

So funktioniert die Abrechnung der Kimi K2.7 Code API

Die Kimi K2.7 Code API verwendet für jede Anfrage ein token-basiertes Preismodell: Jede Interaktion mit dem Modell verbraucht Tokens, die je nach Typ abgerechnet werden. In diesem Modell werden Tokens in der Regel in drei Kategorien eingeteilt: Eingabe-Tokens, Ausgabe-Tokens und zwischengespeicherte Eingabe-Tokens.

Eingabe-Tokens

Eingabe-Tokens umfassen alles, was an das Modell gesendet wird, einschließlich:

  • Nutzer-Prompts

  • Systemanweisungen

  • Gesprächsverlauf oder Kontext

Diese Tokens bestimmen, wie viel Kontext das Modell verarbeiten muss, bevor es eine Antwort erzeugt.

Zwischengespeicherte Eingabe-Tokens

Zwischengespeicherte Eingabe-Tokens entstehen, wenn bereits verarbeiteter Kontext erneut verwendet wird.

  • Wenn derselbe oder ein ähnlicher Kontext erneut verwendet wird, kann er zu reduzierten Kosten bereitgestellt werden

  • Das steigert die Effizienz bei wiederkehrenden Workflows erheblich

  • Besonders nützlich ist das bei Long-Context-Anwendungen oder mehrstufigen Interaktionen

Ausgabe-Tokens

Ausgabe-Tokens werden vom Modell als Antwort auf eine Anfrage erzeugt. Sie stehen für die tatsächlich AI-generierten Inhalte, zum Beispiel:

  • Codegenerierung

  • Textantworten

  • Strukturierte Ausgaben

Da die Erzeugung von Ausgaben zusätzliche Rechenleistung erfordert, sind Ausgabe-Tokens in der Regel teurer als Eingabe-Tokens.

Fazit

Kimi K2.7 Code bietet eine transparente und flexible Preisstruktur, die von einzelnen Entwicklungsprojekten bis hin zu großen Produktions-Workloads skaliert. Mit token-basierter Abrechnung, Cache-Rabatten und einer Highspeed-Modelloption können Entwickler Leistung und Kosten passend zu ihren Anforderungen ausbalancieren. So lassen sich AI-gestützte Coding-Workflows einfacher entwickeln, testen und bereitstellen – bei planbaren Ausgaben.

FAQ

Wie wird die Abrechnung der Kimi K2.7 Code API berechnet?
Die Kimi K2.7 Code API wird pro token abgerechnet. Jede Anfrage verbraucht Eingabe-token (Ihr Prompt plus Kontext) und Ausgabe-token (die vom Modell generierte Antwort). Eingabe-token kosten $0.95 pro 1 Mio. token bei einem Cache-Miss bzw. $0.19 pro 1 Mio. token bei einem Cache-Hit. Ausgabe-token kosten $4.00 pro 1 Mio. token für das Standardmodell und $8.00 pro 1 Mio. token für die Hochgeschwindigkeitsvariante. Alle Preise verstehen sich zzgl. anwendbarer Steuern.
Wie viel kann ich mit Kontext-Caching sparen?
Wenn bereits verarbeiteter Kontext wiederverwendet wird, werden zwischengespeicherte Eingabe-token mit $0.19 pro 1 Mio. token statt mit $0.95 berechnet — eine Senkung der Eingabekosten um 80% bei wiederholtem Kontext. Damit ist Caching besonders effektiv für lange Coding-Sitzungen mit mehreren Dialogrunden, iterative Debugging-Workflows und alle Szenarien, in denen ähnliche Prompts oder Codebase-Kontexte wiederholt gesendet werden.
Sollte ich die API oder einen Kimi-Mitgliedschaftstarif nutzen?
Nutzen Sie die API, wenn Sie ein eigenes Tool, eine CI/CD-Pipeline oder eine interne Entwicklerplattform aufbauen und dafür programmatischen Zugriff sowie eine fein abgestimmte Kontrolle über den token-Verbrauch benötigen. Wählen Sie einen Kimi-Mitgliedschaftstarif (ab $19/Monat), wenn Sie sofortigen Zugriff auf Kimi Code in Terminal und IDE wünschen, ohne API-Schlüssel zu verwalten oder den token-Verbrauch abzuschätzen. Mitgliedschaftstarife enthalten wöchentlich aufgefrischte Kimi Code-Guthaben; höhere Stufen schalten mehr Guthaben und höhere Parallelität frei.
Eignen sich die Preise der Kimi K2.7 Code API für den Einsatz im Enterprise-Maßstab?
Ja. Das token-basierte Modell skaliert von einzelnen Entwicklern bis hin zu Enterprise-Bereitstellungen ohne obere Nutzungslimits. In Szenarien mit hohem Volumen senkt der automatische Kontext-Caching-Mechanismus die Kosten deutlich, wenn ähnliche Eingaben sitzungsübergreifend wiederverwendet werden. Wenn Sie individuelle Enterprise-Konditionen, dedizierten Support oder Mengenrabatte benötigen, wenden Sie sich über die Kimi API Platform an das Kimi-Vertriebsteam.