Kimi K2.6 è un modello open source con capacità SOTA di coding, esecuzione a lungo orizzonte e agent swarm. Di seguito trovi una panoramica dei prezzi della Kimi API e dei piani di abbonamento Kimi.
Panoramica dei prezzi dell'API Kimi K2.6
I prezzi dell'API Kimi K2.6 seguono un modello basato sui token, con utilizzo fatturato per 1M token (1.000.000 token) sia per l'elaborazione di input sia di output, per un controllo dei costi chiaro e prevedibile.
| Modello | Unità | Prezzo input (Cache Hit) | Prezzo input (Cache Miss) | Prezzo output | Finestra di contesto |
|---|---|---|---|---|---|
| kimi-k2.6 | 1M token | $0.16 | $0.95 | $4.00 | 262,144 token |
Modello di prezzi dell'API Kimi K2.6
L'API Kimi K2.6 usa un modello di prezzo basato sui token per ogni richiesta: ogni interazione con il modello consuma token fatturati in base alla tipologia. In questo modello, i token sono generalmente suddivisi in tre categorie: token di input, token di output e token di input memorizzati nella cache.
Token di input
I token di input rappresentano tutto ciò che viene inviato al modello, inclusi:
Prompt dell'utente
Istruzioni di sistema
Cronologia o contesto della conversazione
Questi token determinano quanto contesto il modello deve elaborare prima di generare una risposta.
Token di output
I token di output vengono generati dal modello in risposta a una richiesta. Rappresentano il contenuto effettivamente generato dall'AI, ad esempio:
Risposte testuali
Generazione di codice
Output strutturati
Poiché la generazione dell'output richiede calcolo aggiuntivo, di norma ha un prezzo più alto rispetto ai token di input.
Token di input memorizzati nella cache
I token di input memorizzati nella cache si hanno quando viene riutilizzato un contesto già elaborato.
Se viene riutilizzato un contesto uguale o simile, può essere gestito a un costo ridotto
Questo migliora in modo significativo l'efficienza dei flussi di lavoro ripetitivi
È particolarmente utile nelle applicazioni con contesto lungo o nelle interazioni multi-turn
Note sui prezzi dell'API Kimi K2.6
I prezzi dell'API Kimi K2.6 seguono un modello trasparente basato sul consumo; di seguito sono indicati alcuni dettagli importanti per aiutare gli sviluppatori a comprendere meglio fatturazione e dinamiche dei costi.
Politica fiscale e di fatturazione
Tutti i prezzi indicati per l'API Kimi K2.6 non includono le imposte applicabili. Le imposte vengono calcolate automaticamente al checkout in base all'area di fatturazione dell'utente e ai requisiti fiscali locali, garantendo una fatturazione corretta e conforme per ogni ordine.
Spiegazione dell'utilizzo dei token
Per rendere più chiari i prezzi dell'API Kimi K2.6, la fatturazione viene calcolata con uno standard di token coerente:
1M token = 1,000,000 token
I token di input includono prompt e informazioni di contesto
I token di output rappresentano le risposte generate dal modello
Questa struttura assicura una stima dei costi trasparente e prevedibile per tutte le richieste della Kimi API.
Efficienza dei costi basata sulla cache
Kimi K2.6 include anche un meccanismo di caching che aiuta a ottimizzare i costi di utilizzo. Quando si lavora con input ripetuti o simili, i token di input memorizzati nella cache sono fatturati a una tariffa ridotta, contribuendo ad abbassare il consumo complessivo nel modello di prezzi della Kimi API.
I token di input memorizzati nella cache sono fatturati a una tariffa scontata
Il contesto riutilizzato riduce il consumo totale di token
Migliora l'efficienza nelle sessioni lunghe e nei flussi di lavoro ripetitivi
Questo rende i prezzi dell'API Kimi K2.6 più convenienti negli scenari di produzione in cui prompt o contesti vengono riutilizzati di frequente.
Sebbene non esista un livello gratuito permanente della Kimi API per l'uso in produzione, il modello di prezzo è progettato per rimanere flessibile e scalabile, consentendo agli sviluppatori di controllare i costi in base al consumo effettivo di token.
Piani tariffari e livelli di utilizzo per Kimi K2.6
Oltre ai prezzi basati sull'utilizzo dell'API, Kimi offre piani di abbonamento a livelli che crescono con le tue esigenze, così è facile scegliere il livello giusto per il tuo flusso di lavoro. Questi piani consentono agli utenti di scegliere il livello più adatto in base alle esigenze di utilizzo quotidiano e ai requisiti di scalabilità.
| Funzionalità | Adagio | Moderato | Allegretto | Allegro | Vivace |
|---|---|---|---|---|---|
| Fatturazione annuale (mensile effettivo) | $0 / mese | $15 / mese | $31 / mese | $79 / mese | $159 / mese |
| Utilizzo Agent | 6 | 60 | 150 | 360 | 720 |
| Attività simultanee | 1 attività | 2 attività | 2 attività | 4 attività | 4 attività |
| Coda prioritaria Agent | × | Velocità 4× | Velocità 4× | Velocità 4× | Velocità 4× |
| Agent Swarm | × | × | 50 utilizzi inclusi | 120 utilizzi inclusi | 240 utilizzi inclusi |
| Subagent simultanei | × | × | 4 subagent | 4 subagent | 8 subagent |
| Kimi Code | × | Crediti 1× | Crediti 5× | Crediti 15× | Crediti 30× |
| Kimi Claw | × | × | ✓ | ✓ | ✓ |
| Kimi Claw Android | × | × | ✓ | ✓ | ✓ |
| Kimi Claw (Mac ARM / PC) | × | × | ✓ | ✓ | ✓ |
| Chat di gruppo con Claw | × | × | 10 chat | 10 chat | 10 chat |
| Richieste dati professionali | 200 | 2000 | 5000 | 12000 | 24000 |
| Distribuzione di siti web con database | × | ✓ | ✓ | ✓ | ✓ |
Conclusione
Kimi K2.6 offre prezzi flessibili sia per gli sviluppatori sia per gli utenti di tutti i giorni. Il prezzo dell'API basato sui token mantiene i costi trasparenti e prevedibili, con il supporto della cache per ridurre le spese nei flussi di lavoro ad alto volume o con contesti lunghi. Per chi preferisce un accesso strutturato, i piani di abbonamento a livelli scalano dall'uso gratuito a quello professionale, coprendo funzionalità Agent, attività simultanee e strumenti come Kimi Claw e Agent Swarm. Che tu integri tramite API o voglia esplorare l'intero set di funzionalità di Kimi, c'è un piano pensato per adattarsi al tuo flusso di lavoro e al tuo budget.