Preise für Kimi K2.7 Code erklärt: API-Kosten und Tarife

Q: Wie wird die Abrechnung der Kimi K2.7 Code API berechnet?

Die Kimi K2\.7 Code API wird pro token abgerechnet\. Jede Anfrage verbraucht Eingabe-token $Ihr Prompt plus Kontext$ und Ausgabe-token $die vom Modell generierte Antwort$\. Eingabe-token kosten \$0\.95 pro 1 Mio\. token bei einem Cache-Miss bzw\. \$0\.19 pro 1 Mio\. token bei einem Cache-Hit\. Ausgabe-token kosten \$4\.00 pro 1 Mio\. token für das Standardmodell und \$8\.00 pro 1 Mio\. token für die Hochgeschwindigkeitsvariante\. Alle Preise verstehen sich zzgl\. anwendbarer Steuern\.

Q: Eignen sich die Preise der Kimi K2.7 Code API für den Einsatz im Enterprise-Maßstab?

Ja\. Das token-basierte Modell skaliert von einzelnen Entwicklern bis hin zu Enterprise-Bereitstellungen ohne obere Nutzungslimits\. In Szenarien mit hohem Volumen senkt der automatische Kontext-Caching-Mechanismus die Kosten deutlich, wenn ähnliche Eingaben sitzungsübergreifend wiederverwendet werden\. Wenn Sie individuelle Enterprise-Konditionen, dedizierten Support oder Mengenrabatte benötigen, wenden Sie sich über die Kimi API Platform an das Kimi-Vertriebsteam\.

Jetzt abonnieren

8 Min. Lesezeit2026-06-25

Kimi K2.7 Code-Mitgliedschaftstarife & Nutzungsstufen

Wenn Sie Kimi K2.7 Code direkt in Ihrem Terminal oder Ihrer IDE verwenden möchten, ist ein Kimi Code-Abonnement der einfachste Weg.

	Moderato	Allegretto	Allegro	Vivace
Monatspreis	$19 / Monat	$39 / Monat	$99 / Monat	$199 / Monat
Beschreibung	Wöchentlich aufgefrischte Nutzungskontingente mit Anmeldung auf mehreren Geräten, sodass Sie Ihren Tarif geräteübergreifend nutzen und effizient an mehreren Projekten arbeiten können	Großzügige Wochenlimits und höhere Parallelitätsgrenzen – eine besonders attraktive Lösung für fortgeschrittene Nutzer	Umfangreiches Kontingent für höchste Ansprüche. Bewältigt nahtlos alles von täglichen Aufgaben bis zu intensiver Entwicklung	Unsere höchsten wöchentlichen Tarifkontingente, mit denen Sie komplexe Projekte und große Codebases mühelos bewältigen

Jeder Tarif enthält wöchentlich aufgefrischte Nutzungskontingente. Höhere Stufen bieten größere Wochenlimits und höhere Parallelitätsgrenzen und eignen sich damit für anspruchsvollere Projekte. Die neuesten Tarifdetails finden Sie auf der offiziellen Mitgliedschaftsseite.

Jetzt abonnieren

Was ist über Kimi Code hinaus enthalten?

Mit dem Kauf eines beliebigen Kimi Code-Tarifs werden auch die umfassenderen Vorteile der Kimi-Mitgliedschaft freigeschaltet, die hauptsächlich von Kimi K2.6 unterstützt werden.

	Adagio	Moderato	Allegretto	Allegro	Vivace
Preis	$0	$19 / Monat	$39 / Monat	$99 / Monat	$199 / Monat
Agent-Nutzung	6	60	150	360	720
Gleichzeitige Agent-Aufgaben	1 Aufgabe	2 Aufgaben	2 Aufgaben	4 Aufgaben	4 Aufgaben
Agent-Prioritätswarteschlange	✗	4x Geschwindigkeit	4x Geschwindigkeit	4x Geschwindigkeit	4x Geschwindigkeit
Agent Swarm	✗	25 Nutzungen enthalten	50 Nutzungen enthalten	120 Nutzungen enthalten	240 Nutzungen enthalten
Gleichzeitige Subagents in Agent Swarm	✗	2 Subagents	4 Subagents	4 Subagents	8 Subagents
Kimi Claw	✗	✗	✓	✓	✓
Kimi Claw Android	✗	✗	✓	✓	✓
Kimi Claw PC	✗	✗	✓	✓	✓
Gruppenchat mit Claw	✗	✗	10 Gruppenchats	10 Gruppenchats	10 Gruppenchats
Website mit Datenbank bereitstellen	✗	✓	✓	✓	✓
Aktive geplante Aufgaben in Kimi Work	2 Aufgaben	10 Aufgaben	15 Aufgaben	20 Aufgaben	20 Aufgaben

Diese produktübergreifenden Vorteile stehen in allen kostenpflichtigen Tarifen zusätzlich zu deiner Kimi K2.7 Code-Nutzung zur Verfügung – damit erhältst du in einem Abo sowohl einen spezialisierten Coding-Agent als auch einen vollständigen AI-Workspace.

Jetzt abonnieren

Preise der Kimi K2.7 Code API

Die Preise der Kimi K2.7 Code API basieren auf einem token-basierten Modell: Sowohl Eingabe- als auch Ausgabeverarbeitung werden pro 1M Tokens (1.000.000 Tokens) abgerechnet. So bleiben die Kosten klar und gut planbar.

Modell	Einheit	Eingabepreis (Cache-Treffer)	Eingabepreis (Cache-Fehlschlag)	Ausgabepreis	Kontextfenster
kimi-k2.7-code	1M Tokens	$0.19	$0.95	$4.00	262,144 Tokens
kimi-k2.7-code-highspeed	1M Tokens	$0.38	$1.90	$8.00	262,144 Tokens

Das Standardmodell kimi-k2.7-code bietet Kimis leistungsfähigste Coding-Intelligenz und unterstützt Long-Context-Reasoning sowie agentische Aufgaben vollständig. Die Variante kimi-k2.7-code-highspeed erreicht eine Ausgabegeschwindigkeit von etwa 180 Tokens/s (bis zu 260 Tokens/s bei kurzen Kontexten) und sorgt damit für ein besonders schnelles Coding-Erlebnis in latenzsensiblen Workflows.

API-Guthaben erhalten

So funktioniert die Abrechnung der Kimi K2.7 Code API

Die Kimi K2.7 Code API verwendet für jede Anfrage ein token-basiertes Preismodell: Jede Interaktion mit dem Modell verbraucht Tokens, die je nach Typ abgerechnet werden. In diesem Modell werden Tokens in der Regel in drei Kategorien eingeteilt: Eingabe-Tokens, Ausgabe-Tokens und zwischengespeicherte Eingabe-Tokens.

Eingabe-Tokens

Eingabe-Tokens umfassen alles, was an das Modell gesendet wird, einschließlich:

Nutzer-Prompts
Systemanweisungen
Gesprächsverlauf oder Kontext

Diese Tokens bestimmen, wie viel Kontext das Modell verarbeiten muss, bevor es eine Antwort erzeugt.

Zwischengespeicherte Eingabe-Tokens

Zwischengespeicherte Eingabe-Tokens entstehen, wenn bereits verarbeiteter Kontext erneut verwendet wird.

Wenn derselbe oder ein ähnlicher Kontext erneut verwendet wird, kann er zu reduzierten Kosten bereitgestellt werden
Das steigert die Effizienz bei wiederkehrenden Workflows erheblich
Besonders nützlich ist das bei Long-Context-Anwendungen oder mehrstufigen Interaktionen

Ausgabe-Tokens

Ausgabe-Tokens werden vom Modell als Antwort auf eine Anfrage erzeugt. Sie stehen für die tatsächlich AI-generierten Inhalte, zum Beispiel:

Codegenerierung
Textantworten
Strukturierte Ausgaben

Da die Erzeugung von Ausgaben zusätzliche Rechenleistung erfordert, sind Ausgabe-Tokens in der Regel teurer als Eingabe-Tokens.

API-Guthaben erhalten

Fazit

Kimi K2.7 Code bietet eine transparente und flexible Preisstruktur, die von einzelnen Entwicklungsprojekten bis hin zu großen Produktions-Workloads skaliert. Mit token-basierter Abrechnung, Cache-Rabatten und einer Highspeed-Modelloption können Entwickler Leistung und Kosten passend zu ihren Anforderungen ausbalancieren. So lassen sich AI-gestützte Coding-Workflows einfacher entwickeln, testen und bereitstellen – bei planbaren Ausgaben.

FAQ

Wie wird die Abrechnung der Kimi K2.7 Code API berechnet?

Die Kimi K2.7 Code API wird pro token abgerechnet. Jede Anfrage verbraucht Eingabe-token (Ihr Prompt plus Kontext) und Ausgabe-token (die vom Modell generierte Antwort). Eingabe-token kosten $0.95 pro 1 Mio. token bei einem Cache-Miss bzw. $0.19 pro 1 Mio. token bei einem Cache-Hit. Ausgabe-token kosten $4.00 pro 1 Mio. token für das Standardmodell und $8.00 pro 1 Mio. token für die Hochgeschwindigkeitsvariante. Alle Preise verstehen sich zzgl. anwendbarer Steuern.

Wie viel kann ich mit Kontext-Caching sparen?

Wenn bereits verarbeiteter Kontext wiederverwendet wird, werden zwischengespeicherte Eingabe-token mit $0.19 pro 1 Mio. token statt mit $0.95 berechnet — eine Senkung der Eingabekosten um 80% bei wiederholtem Kontext. Damit ist Caching besonders effektiv für lange Coding-Sitzungen mit mehreren Dialogrunden, iterative Debugging-Workflows und alle Szenarien, in denen ähnliche Prompts oder Codebase-Kontexte wiederholt gesendet werden.

Sollte ich die API oder einen Kimi-Mitgliedschaftstarif nutzen?

Nutzen Sie die API, wenn Sie ein eigenes Tool, eine CI/CD-Pipeline oder eine interne Entwicklerplattform aufbauen und dafür programmatischen Zugriff sowie eine fein abgestimmte Kontrolle über den token-Verbrauch benötigen. Wählen Sie einen Kimi-Mitgliedschaftstarif (ab $19/Monat), wenn Sie sofortigen Zugriff auf Kimi Code in Terminal und IDE wünschen, ohne API-Schlüssel zu verwalten oder den token-Verbrauch abzuschätzen. Mitgliedschaftstarife enthalten wöchentlich aufgefrischte Kimi Code-Guthaben; höhere Stufen schalten mehr Guthaben und höhere Parallelität frei.

Eignen sich die Preise der Kimi K2.7 Code API für den Einsatz im Enterprise-Maßstab?

Ja. Das token-basierte Modell skaliert von einzelnen Entwicklern bis hin zu Enterprise-Bereitstellungen ohne obere Nutzungslimits. In Szenarien mit hohem Volumen senkt der automatische Kontext-Caching-Mechanismus die Kosten deutlich, wenn ähnliche Eingaben sitzungsübergreifend wiederverwendet werden. Wenn Sie individuelle Enterprise-Konditionen, dedizierten Support oder Mengenrabatte benötigen, wenden Sie sich über die Kimi API Platform an das Kimi-Vertriebsteam.

Das könnte Ihnen auch gefallen

Kimi Code: KI-Code-Agent der nächsten Generation für Terminal & IDE

2026-06-22

Der Moonshot AI-Refactor mit Kimi Code CLI

2026-06-17

10 echte Vibe-Coding-Beispiele | Erstelle noch heute etwas mit KI

2026-06-17

Kimi Code CLI-Kurzreferenz: Befehle, Tastenkürzel & Workflows

2026-06-22