Kimi K2.6 ist ein Open-Source-Modell mit State-of-the-Art-Fähigkeiten für Coding, Long-Horizon Execution und agent swarm. Unten finden Sie einen Überblick über die Preise der Kimi API und die Kimi Mitgliedschaftstarife.
Preisübersicht der Kimi K2.6 API
Die Preisgestaltung der Kimi K2.6 API nutzt ein token-basiertes Modell. Die Nutzung wird für Eingabe- und Ausgabeverarbeitung pro 1M tokens (1.000.000 tokens) abgerechnet und ermöglicht eine klare, planbare Kostenkontrolle.
| Modell | Einheit | Eingabepreis (Cache Hit) | Eingabepreis (Cache Miss) | Ausgabepreis | Kontextfenster |
|---|---|---|---|---|---|
| kimi-k2.6 | 1M tokens | $0.16 | $0.95 | $4.00 | 262,144 tokens |
Preismodell der Kimi K2.6 API
Die Kimi K2.6 API verwendet für jede Anfrage ein token-basiertes Preismodell: Jede Interaktion mit dem Modell verbraucht tokens, die je nach Typ abgerechnet werden. In diesem Modell werden tokens im Allgemeinen in drei Arten eingeteilt: input tokens, output tokens und cached input tokens.
Input tokens
Input tokens umfassen alles, was an das Modell gesendet wird, darunter:
Prompts von Nutzern
Systemanweisungen
Gesprächsverlauf oder Kontext
Diese tokens bestimmen, wie viel Kontext das Modell verarbeiten muss, bevor es eine Antwort generiert.
Output tokens
Output tokens werden vom Modell als Antwort auf eine Anfrage erzeugt. Sie stehen für die tatsächlich KI-generierten Inhalte, zum Beispiel:
Textantworten
Codegenerierung
Strukturierte Ausgaben
Da die Erzeugung von output zusätzliche Rechenleistung erfordert, ist sie in der Regel teurer als input tokens.
Cached input tokens
Cached input tokens entstehen, wenn zuvor verarbeiteter Kontext wiederverwendet wird.
Wenn derselbe oder ein ähnlicher Kontext erneut verwendet wird, kann er zu geringeren Kosten bereitgestellt werden
Das steigert die Effizienz bei wiederkehrenden Workflows erheblich
Besonders nützlich ist dies bei Long-Context-Anwendungen oder Multi-Turn-Interaktionen
Hinweise zur Preisgestaltung der Kimi K2.6 API
Die Preisgestaltung der Kimi K2.6 API folgt einem transparenten, verbrauchsabhängigen Modell. Einige wichtige Details unten helfen Entwicklern, Abrechnung und Kostenverhalten besser zu verstehen.
Steuer- und Abrechnungsrichtlinie
Alle für die Kimi K2.6 API angegebenen Preise verstehen sich ohne anfallende Steuern. Die Steuern werden beim Checkout automatisch anhand der Abrechnungsregion des Nutzers und der lokalen Steuervorgaben berechnet, sodass jede Bestellung korrekt und regelkonform abgerechnet wird.
Erläuterung der token-Nutzung
Damit die Preisgestaltung der Kimi K2.6 API leichter nachvollziehbar ist, erfolgt die Abrechnung nach einem einheitlichen token-Standard:
1M tokens = 1,000,000 tokens
Input tokens umfassen Prompts und Kontextinformationen
Output tokens stehen für vom Modell generierte Antworten
Diese Struktur sorgt für transparente und planbare Kostenschätzungen über alle Anfragen an die Kimi API hinweg.
Kostenoptimierung durch Cache-Nutzung
Kimi K2.6 umfasst außerdem einen Caching-Mechanismus, der die Nutzungskosten optimiert. Bei wiederholten oder ähnlichen Eingaben werden cached input tokens zu einem reduzierten Preis abgerechnet, wodurch sich der Gesamtverbrauch im Preismodell der Kimi API senken lässt.
Cached input tokens werden zu einem rabattierten Preis abgerechnet
Wiederverwendeter Kontext reduziert den gesamten token-Verbrauch
Verbessert die Effizienz bei langen Sitzungen und wiederkehrenden Workflows
Dadurch wird die Preisgestaltung der Kimi K2.6 API für Produktionsszenarien kosteneffizienter, in denen Prompts oder Kontexte häufig wiederverwendet werden.
Auch wenn es keinen dauerhaft kostenlosen Tarif der Kimi API für die Produktionsnutzung gibt, ist das Preismodell flexibel und skalierbar angelegt, sodass Entwickler ihre Kosten nach dem tatsächlichen token-Verbrauch steuern können.
Preistarife und Nutzungsstufen für Kimi K2.6
Zusätzlich zur API-basierten nutzungsabhängigen Preisgestaltung bietet Kimi gestaffelte Mitgliedschaftstarife, die mit Ihren Anforderungen wachsen und die Wahl der passenden Stufe für Ihren Workflow erleichtern. So können Nutzer je nach täglichem Nutzungsbedarf und Skalierungsanforderungen den am besten geeigneten Tarif wählen.
| Funktion | Adagio | Moderato | Allegretto | Allegro | Vivace |
|---|---|---|---|---|---|
| Jährliche Abrechnung (effektiv monatlich) | $0 / Monat | $15 / Monat | $31 / Monat | $79 / Monat | $159 / Monat |
| Agent-Nutzung | 6 | 60 | 150 | 360 | 720 |
| Gleichzeitige Aufgaben | 1 Aufgabe | 2 Aufgaben | 2 Aufgaben | 4 Aufgaben | 4 Aufgaben |
| Agent-Prioritätswarteschlange | × | 4× Geschwindigkeit | 4× Geschwindigkeit | 4× Geschwindigkeit | 4× Geschwindigkeit |
| Agent Swarm | × | × | 50 Nutzungen enthalten | 120 Nutzungen enthalten | 240 Nutzungen enthalten |
| Gleichzeitige Subagents | × | × | 4 Subagents | 4 Subagents | 8 Subagents |
| Kimi Code | × | 1× Credits | 5× Credits | 15× Credits | 30× Credits |
| Kimi Claw | × | × | ✓ | ✓ | ✓ |
| Kimi Claw Android | × | × | ✓ | ✓ | ✓ |
| Kimi Claw (Mac ARM / PC) | × | × | ✓ | ✓ | ✓ |
| Gruppenchat mit Claw | × | × | 10 Chats | 10 Chats | 10 Chats |
| Professionelle Datenanfragen | 200 | 2000 | 5000 | 12000 | 24000 |
| Website mit Datenbank bereitstellen | × | ✓ | ✓ | ✓ | ✓ |
Fazit
Kimi K2.6 bietet flexible Preise für Entwickler ebenso wie für Alltagsnutzer. Die token-basierte API-Preisgestaltung macht Kosten transparent und planbar; Caching hilft, Ausgaben bei hohem Anfragevolumen oder Workflows mit langem Kontext zu senken. Wer einen klar strukturierten Zugang bevorzugt, findet gestaffelte Mitgliedschaftstarife von kostenlos bis professionell – mit Agent-Funktionen, gleichzeitigen Aufgaben sowie Tools wie Kimi Claw und Agent Swarm. Ob Sie per API integrieren oder den gesamten Funktionsumfang von Kimi erkunden: Es gibt einen Tarif, der zu Ihrem Workflow und Budget passt.