Prezzi di Kimi K2.6 per API e abbonamento

8 min di lettura2026-06-17

Kimi K2.6 è un modello open source con capacità SOTA di coding, esecuzione a lungo orizzonte e agent swarm. Di seguito trovi una panoramica dei prezzi della Kimi API e dei piani di abbonamento Kimi.

Panoramica dei prezzi dell'API Kimi K2.6

I prezzi dell'API Kimi K2.6 seguono un modello basato sui token, con utilizzo fatturato per 1M token (1.000.000 token) sia per l'elaborazione di input sia di output, per un controllo dei costi chiaro e prevedibile.

ModelloUnitàPrezzo input (Cache Hit)Prezzo input (Cache Miss)Prezzo outputFinestra di contesto
kimi-k2.61M token$0.16$0.95$4.00262,144 token

Modello di prezzi dell'API Kimi K2.6

L'API Kimi K2.6 usa un modello di prezzo basato sui token per ogni richiesta: ogni interazione con il modello consuma token fatturati in base alla tipologia. In questo modello, i token sono generalmente suddivisi in tre categorie: token di input, token di output e token di input memorizzati nella cache.

Token di input

I token di input rappresentano tutto ciò che viene inviato al modello, inclusi:

  • Prompt dell'utente

  • Istruzioni di sistema

  • Cronologia o contesto della conversazione

Questi token determinano quanto contesto il modello deve elaborare prima di generare una risposta.

Token di output

I token di output vengono generati dal modello in risposta a una richiesta. Rappresentano il contenuto effettivamente generato dall'AI, ad esempio:

  • Risposte testuali

  • Generazione di codice

  • Output strutturati

Poiché la generazione dell'output richiede calcolo aggiuntivo, di norma ha un prezzo più alto rispetto ai token di input.

Token di input memorizzati nella cache

I token di input memorizzati nella cache si hanno quando viene riutilizzato un contesto già elaborato.

  • Se viene riutilizzato un contesto uguale o simile, può essere gestito a un costo ridotto

  • Questo migliora in modo significativo l'efficienza dei flussi di lavoro ripetitivi

  • È particolarmente utile nelle applicazioni con contesto lungo o nelle interazioni multi-turn

Note sui prezzi dell'API Kimi K2.6

I prezzi dell'API Kimi K2.6 seguono un modello trasparente basato sul consumo; di seguito sono indicati alcuni dettagli importanti per aiutare gli sviluppatori a comprendere meglio fatturazione e dinamiche dei costi.

Politica fiscale e di fatturazione

Tutti i prezzi indicati per l'API Kimi K2.6 non includono le imposte applicabili. Le imposte vengono calcolate automaticamente al checkout in base all'area di fatturazione dell'utente e ai requisiti fiscali locali, garantendo una fatturazione corretta e conforme per ogni ordine.

Spiegazione dell'utilizzo dei token

Per rendere più chiari i prezzi dell'API Kimi K2.6, la fatturazione viene calcolata con uno standard di token coerente:

  • 1M token = 1,000,000 token

  • I token di input includono prompt e informazioni di contesto

  • I token di output rappresentano le risposte generate dal modello

Questa struttura assicura una stima dei costi trasparente e prevedibile per tutte le richieste della Kimi API.

Efficienza dei costi basata sulla cache

Kimi K2.6 include anche un meccanismo di caching che aiuta a ottimizzare i costi di utilizzo. Quando si lavora con input ripetuti o simili, i token di input memorizzati nella cache sono fatturati a una tariffa ridotta, contribuendo ad abbassare il consumo complessivo nel modello di prezzi della Kimi API.

  • I token di input memorizzati nella cache sono fatturati a una tariffa scontata

  • Il contesto riutilizzato riduce il consumo totale di token

  • Migliora l'efficienza nelle sessioni lunghe e nei flussi di lavoro ripetitivi

Questo rende i prezzi dell'API Kimi K2.6 più convenienti negli scenari di produzione in cui prompt o contesti vengono riutilizzati di frequente.

Sebbene non esista un livello gratuito permanente della Kimi API per l'uso in produzione, il modello di prezzo è progettato per rimanere flessibile e scalabile, consentendo agli sviluppatori di controllare i costi in base al consumo effettivo di token.

Piani tariffari e livelli di utilizzo per Kimi K2.6

Oltre ai prezzi basati sull'utilizzo dell'API, Kimi offre piani di abbonamento a livelli che crescono con le tue esigenze, così è facile scegliere il livello giusto per il tuo flusso di lavoro. Questi piani consentono agli utenti di scegliere il livello più adatto in base alle esigenze di utilizzo quotidiano e ai requisiti di scalabilità.

FunzionalitàAdagioModeratoAllegrettoAllegroVivace
Fatturazione annuale (mensile effettivo)$0 / mese$15 / mese$31 / mese$79 / mese$159 / mese
Utilizzo Agent660150360720
Attività simultanee1 attività2 attività2 attività4 attività4 attività
Coda prioritaria Agent×Velocità 4×Velocità 4×Velocità 4×Velocità 4×
Agent Swarm××50 utilizzi inclusi120 utilizzi inclusi240 utilizzi inclusi
Subagent simultanei××4 subagent4 subagent8 subagent
Kimi Code×Crediti 1×Crediti 5×Crediti 15×Crediti 30×
Kimi Claw××
Kimi Claw Android××
Kimi Claw (Mac ARM / PC)××
Chat di gruppo con Claw××10 chat10 chat10 chat
Richieste dati professionali200200050001200024000
Distribuzione di siti web con database×

Conclusione

Kimi K2.6 offre prezzi flessibili sia per gli sviluppatori sia per gli utenti di tutti i giorni. Il prezzo dell'API basato sui token mantiene i costi trasparenti e prevedibili, con il supporto della cache per ridurre le spese nei flussi di lavoro ad alto volume o con contesti lunghi. Per chi preferisce un accesso strutturato, i piani di abbonamento a livelli scalano dall'uso gratuito a quello professionale, coprendo funzionalità Agent, attività simultanee e strumenti come Kimi Claw e Agent Swarm. Che tu integri tramite API o voglia esplorare l'intero set di funzionalità di Kimi, c'è un piano pensato per adattarsi al tuo flusso di lavoro e al tuo budget.

Domande frequenti

Come vengono calcolati i prezzi dell'API Kimi K2.6?
I prezzi dell'API Kimi K2.6 sono calcolati in base all'utilizzo dei token, inclusi token di input, token di output e token di input memorizzati nella cache. Tutto l'utilizzo viene fatturato per 1M token (1.000.000 token), rendendo i costi della Kimi API facili da misurare e prevedere su diversi carichi di lavoro.
Che cosa incide maggiormente sul costo totale dell'API?
I principali fattori di costo sono l'utilizzo dei token di output, la lunghezza del prompt e la dimensione del contesto. Nella maggior parte dei casi, risposte più lunghe e input più ampi aumentano l'utilizzo complessivo nel modello di prezzo dell'API K2.6.
L'API Kimi K2.6 costa meno con i token in cache?
Sì. I token di input memorizzati nella cache sono fatturati a una tariffa ridotta perché è possibile riutilizzare il contesto già elaborato. Questo rende i prezzi della Kimi API più efficienti per richieste ripetute o simili.
Quanti token supporta Kimi K2.6 per richiesta?
Il modello supporta una finestra di contesto massima di 256K token, così può gestire documenti lunghi, conversazioni estese e attività complesse in più passaggi all'interno di una singola richiesta.
Che cosa succede se il mio input supera la finestra di contesto?
Kimi K2.6 supporta fino a 256K token per richiesta. Se l'input supera questo limite, deve essere suddiviso o abbreviato prima dell'elaborazione tramite la Kimi API.
Kimi K2.6 supporta l'utilizzo ad alto volume o su scala enterprise?
Sì. Kimi K2.6 è progettato per carichi di lavoro scalabili e supporta sia applicazioni leggere sia scenari enterprise ad alta capacità, con prezzi basati sui token prevedibili.
L'API Kimi K2.6 prevede costi nascosti?
No. Il modello di prezzi della Kimi API è completamente trasparente e si basa esclusivamente sull'utilizzo dei token. Non sono previsti costi nascosti di piattaforma, anche se possono applicarsi imposte in base all'area geografica dell'utente.