Piani di abbonamento e fasce d'uso di Kimi K2.7 Code
Se vuoi usare Kimi K2.7 Code direttamente nel terminale o nell'IDE, la soluzione più semplice è un abbonamento Kimi Code.
| Moderato | Allegretto | Allegro | Vivace | |
|---|---|---|---|---|
| Prezzo mensile | $19 / mese | $39 / mese | $99 / mese | $199 / mese |
| Descrizione | Quote di utilizzo aggiornate ogni settimana e accesso multi-dispositivo, per condividere il piano tra più dispositivi e lavorare con efficienza su più progetti | Limiti settimanali generosi e soglie di concorrenza più alte: una soluzione di grande valore per utenti avanzati | Quota ampia, pensata per l'eccellenza. Gestisce senza interruzioni sia le attività quotidiane sia lo sviluppo intensivo | Le nostre quote settimanali più elevate, per gestire con facilità progetti complessi e codebase di grandi dimensioni |
Ogni piano include quote di utilizzo aggiornate ogni settimana. I livelli superiori offrono limiti settimanali più ampi e soglie di concorrenza più alte, risultando adatti ai progetti più impegnativi. Per i dettagli più aggiornati sui piani, consulta la pagina ufficiale degli abbonamenti.
Cosa è incluso oltre a Kimi Code?
L'acquisto di qualsiasi piano Kimi Code sblocca anche i vantaggi più ampi dell'abbonamento Kimi, basati principalmente su Kimi K2.6.
| Adagio | Moderato | Allegretto | Allegro | Vivace | |
|---|---|---|---|---|---|
| Prezzo | $0 | $19 / mese | $39 / mese | $99 / mese | $199 / mese |
| Utilizzo Agent | 6 | 60 | 150 | 360 | 720 |
| Attività Agent simultanee | 1 attività | 2 attività | 2 attività | 4 attività | 4 attività |
| Coda prioritaria Agent | ✗ | velocità 4x | velocità 4x | velocità 4x | velocità 4x |
| Agent Swarm | ✗ | 25 utilizzi inclusi | 50 utilizzi inclusi | 120 utilizzi inclusi | 240 utilizzi inclusi |
| Subagent simultanei di Agent Swarm | ✗ | 2 subagent | 4 subagent | 4 subagent | 8 subagent |
| Kimi Claw | ✗ | ✗ | ✓ | ✓ | ✓ |
| Kimi Claw Android | ✗ | ✗ | ✓ | ✓ | ✓ |
| Kimi Claw PC | ✗ | ✗ | ✓ | ✓ | ✓ |
| Chat di gruppo con Claw | ✗ | ✗ | 10 chat di gruppo | 10 chat di gruppo | 10 chat di gruppo |
| Distribuzione di un sito web con database | ✗ | ✓ | ✓ | ✓ | ✓ |
| Attività pianificate attive di Kimi Work | 2 attività | 10 attività | 15 attività | 20 attività | 20 attività |
Questi vantaggi trasversali ai prodotti sono disponibili in tutti i livelli a pagamento insieme al tuo utilizzo di Kimi K2.7 Code, offrendoti in un unico abbonamento sia un agent dedicato al coding sia un workspace AI completo.
Prezzi dell'API Kimi K2.7 Code
I prezzi dell'API Kimi K2.7 Code seguono un modello basato sui token, con utilizzo fatturato per 1M di token (1.000.000 di token) sia per l'elaborazione dell'input sia per quella dell'output, così da offrire un controllo dei costi chiaro e prevedibile.
| Modello | Unità | Prezzo input (cache hit) | Prezzo input (cache miss) | Prezzo output | Finestra di contesto |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M token | $0.19 | $0.95 | $4.00 | 262,144 token |
| kimi-k2.7-code-highspeed | 1M token | $0.38 | $1.90 | $8.00 | 262,144 token |
Il modello standard kimi-k2.7-code offre le prestazioni di coding più intelligenti di Kimi, con pieno supporto al ragionamento su contesti lunghi e alle attività agentiche. La variante kimi-k2.7-code-highspeed raggiunge una velocità di output di circa 180 Tokens/s (fino a 260 Tokens/s in scenari con contesto breve), offrendo un'esperienza di coding estrema per i flussi di lavoro sensibili alla latenza.
Come funziona la fatturazione dell'API Kimi K2.7 Code
L'API Kimi K2.7 Code utilizza per ogni richiesta un modello di prezzo basato sui token, in cui ogni interazione con il modello consuma token fatturati in base alla tipologia. In questo modello, i token sono generalmente suddivisi in tre categorie: token di input, token di output e token di input in cache.
Token di input
I token di input rappresentano tutto ciò che viene inviato al modello, tra cui:
Prompt utente
Istruzioni di sistema
Cronologia o contesto della conversazione
Questi token determinano quanto contesto il modello deve elaborare prima di generare una risposta.
Token di input in cache
I token di input in cache si verificano quando viene riutilizzato un contesto già elaborato.
Se viene riutilizzato un contesto uguale o simile, può essere servito a un costo ridotto
Questo aumenta notevolmente l'efficienza nei flussi di lavoro ripetitivi
È particolarmente utile nelle applicazioni con contesti lunghi o nelle interazioni multi-turn
Token di output
I token di output vengono generati dal modello in risposta a una richiesta. Rappresentano il contenuto effettivamente prodotto dall'AI, ad esempio:
Generazione di codice
Risposte testuali
Output strutturati
Poiché la generazione dell'output richiede calcolo aggiuntivo, in genere ha un prezzo superiore rispetto ai token di input.
Conclusione
Kimi K2.7 Code offre una struttura di prezzi trasparente e flessibile, adatta sia ai progetti di sviluppo individuali sia ai grandi carichi di lavoro in produzione. Con fatturazione basata sui token, sconti per la cache e un'opzione di modello ad alta velocità, gli sviluppatori possono bilanciare prestazioni e costi in base alle proprie esigenze specifiche. Così è più semplice creare, testare e distribuire flussi di lavoro di coding basati sull'AI mantenendo la spesa prevedibile.