Tarifs de Kimi K2.7 Code : coûts et offres API

Q: Comment la facturation de l’API Kimi K2.7 Code est-elle calculée ?

L’API Kimi K2\.7 Code est facturée au token\. Chaque requête consomme des tokens d’entrée $votre prompt et le contexte$ et des tokens de sortie $la réponse générée par le modèle$\. Les tokens d’entrée sont facturés \$0\.95 par 1M de tokens en cas d’absence dans le cache, ou \$0\.19 par 1M de tokens en cas de cache hit\. Les tokens de sortie sont facturés \$4\.00 par 1M de tokens pour le modèle standard, et \$8\.00 par 1M de tokens pour la variante haute vitesse\. Tous les prix s’entendent hors taxes applicables\.

Q: Les tarifs de l’API Kimi K2.7 Code conviennent-ils à un usage à l’échelle de l’entreprise ?

Oui\. Le modèle basé sur les tokens s’adapte aussi bien aux développeurs individuels qu’aux déploiements en entreprise, sans limite supérieure d’utilisation\. Pour les scénarios à fort volume, le mécanisme automatique de mise en cache du contexte réduit nettement les coûts lorsque des entrées similaires sont réutilisées d’une session à l’autre\. Si vous avez besoin de conditions entreprise personnalisées, d’un support dédié ou de remises sur volume, contactez l’équipe commerciale Kimi via la Kimi API Platform\.

S’abonner maintenant

8 min de lecture2026-06-25

Formules d’abonnement Kimi K2.7 Code et niveaux d’utilisation

Pour utiliser Kimi K2.7 Code directement dans votre terminal ou votre IDE, la solution la plus simple consiste à souscrire un abonnement Kimi Code.

	Moderato	Allegretto	Allegro	Vivace
Prix mensuel	$19 / mois	$39 / mois	$99 / mois	$199 / mois
Description	Quotas d’utilisation renouvelés chaque semaine avec connexion multi-appareils, pour partager votre offre entre plusieurs appareils et travailler efficacement sur plusieurs projets	Limites hebdomadaires généreuses et plafonds de concurrence relevés, pour une solution très avantageuse destinée aux utilisateurs avancés	Quota étendu, pensé pour l’excellence. Gère sans effort aussi bien les tâches quotidiennes que le développement intensif	Nos quotas hebdomadaires les plus élevés, pour mener facilement des projets complexes et de vastes bases de code

Chaque offre inclut des quotas d’utilisation renouvelés chaque semaine. Les niveaux supérieurs offrent des limites hebdomadaires plus élevées et des plafonds de concurrence accrus, ce qui les rend adaptés aux projets les plus exigeants. Pour connaître les dernières informations sur les offres, consultez la page officielle des abonnements.

S’abonner maintenant

Qu’est-ce qui est inclus en plus de Kimi Code ?

L’achat d’une offre Kimi Code débloque également les avantages plus larges de l’abonnement Kimi, principalement propulsés par Kimi K2.6.

	Adagio	Moderato	Allegretto	Allegro	Vivace
Prix	$0	$19 / mois	$39 / mois	$99 / mois	$199 / mois
Utilisation de l’Agent	6	60	150	360	720
Tâches Agent simultanées	1 tâche	2 tâches	2 tâches	4 tâches	4 tâches
File prioritaire Agent	✗	Vitesse 4x	Vitesse 4x	Vitesse 4x	Vitesse 4x
Agent Swarm	✗	25 utilisations incluses	50 utilisations incluses	120 utilisations incluses	240 utilisations incluses
Sous-agents Agent Swarm simultanés	✗	2 sous-agents	4 sous-agents	4 sous-agents	8 sous-agents
Kimi Claw	✗	✗	✓	✓	✓
Kimi Claw Android	✗	✗	✓	✓	✓
Kimi Claw PC	✗	✗	✓	✓	✓
Discussion de groupe avec Claw	✗	✗	10 discussions de groupe	10 discussions de groupe	10 discussions de groupe
Déployer un site web avec une base de données	✗	✓	✓	✓	✓
Tâches planifiées actives Kimi Work	2 tâches	10 tâches	15 tâches	20 tâches	20 tâches

Ces avantages transverses à plusieurs produits sont disponibles dans toutes les offres payantes en complément de votre utilisation de Kimi K2.7 Code : vous bénéficiez ainsi, dans un seul abonnement, d’un agent de codage dédié et d’un espace de travail IA complet.

S’abonner maintenant

Tarifs de l’API Kimi K2.7 Code

Les tarifs de l’API Kimi K2.7 Code reposent sur un modèle au token, avec une facturation par 1M de tokens (1 000 000 tokens) pour le traitement des entrées comme des sorties, afin d’offrir un contrôle des coûts clair et prévisible.

Modèle	Unité	Prix en entrée (cache hit)	Prix en entrée (cache miss)	Prix en sortie	Fenêtre de contexte
kimi-k2.7-code	1M de tokens	$0.19	$0.95	$4.00	262 144 tokens
kimi-k2.7-code-highspeed	1M de tokens	$0.38	$1.90	$8.00	262 144 tokens

Le modèle standard kimi-k2.7-code offre les performances de codage les plus intelligentes de Kimi, avec une prise en charge complète du raisonnement à long contexte et des tâches agentiques. La variante kimi-k2.7-code-highspeed atteint une vitesse de sortie d’environ 180 Tokens/s (jusqu’à 260 Tokens/s dans les scénarios à contexte court), pour une expérience de codage extrême dans les workflows sensibles à la latence.

Obtenir des crédits API

Fonctionnement de la facturation de l’API Kimi K2.7 Code

L’API Kimi K2.7 Code utilise, pour chaque requête, un modèle de tarification au token : chaque interaction avec le modèle consomme des tokens facturés selon leur type. Dans ce modèle, les tokens sont généralement répartis en trois catégories : tokens d’entrée, tokens de sortie et tokens d’entrée mis en cache.

Tokens d’entrée

Les tokens d’entrée correspondent à tout ce qui est envoyé au modèle, notamment :

Prompts utilisateur
Instructions système
Historique ou contexte de conversation

Ces tokens déterminent la quantité de contexte que le modèle doit traiter avant de générer une réponse.

Tokens d’entrée mis en cache

Les tokens d’entrée mis en cache apparaissent lorsqu’un contexte déjà traité est réutilisé.

Si un contexte identique ou similaire est réutilisé, il peut être servi à moindre coût
Cela améliore nettement l’efficacité des workflows répétitifs
C’est particulièrement utile dans les applications à long contexte ou les interactions à plusieurs tours

Tokens de sortie

Les tokens de sortie sont générés par le modèle en réponse à une requête. Ils correspondent au contenu effectivement produit par l’IA, par exemple :

Génération de code
Réponses textuelles
Sorties structurées

La génération de sortie nécessitant des calculs supplémentaires, son tarif est généralement plus élevé que celui des tokens d’entrée.

Obtenir des crédits API

Conclusion

Kimi K2.7 Code propose une grille tarifaire transparente et flexible, adaptée aussi bien aux projets de développement individuels qu’aux charges de production à grande échelle. Grâce à la facturation au token, aux remises liées au cache et à l’option de modèle haute vitesse, les développeurs peuvent ajuster le compromis entre performances et coût selon leurs besoins. Il devient ainsi plus simple de créer, tester et déployer des workflows de codage optimisés par l’IA, tout en gardant des dépenses prévisibles.

FAQ

Comment la facturation de l’API Kimi K2.7 Code est-elle calculée ?

L’API Kimi K2.7 Code est facturée au token. Chaque requête consomme des tokens d’entrée (votre prompt et le contexte) et des tokens de sortie (la réponse générée par le modèle). Les tokens d’entrée sont facturés $0.95 par 1M de tokens en cas d’absence dans le cache, ou $0.19 par 1M de tokens en cas de cache hit. Les tokens de sortie sont facturés $4.00 par 1M de tokens pour le modèle standard, et $8.00 par 1M de tokens pour la variante haute vitesse. Tous les prix s’entendent hors taxes applicables.

Combien puis-je économiser avec la mise en cache du contexte ?

Lorsqu’un contexte déjà traité est réutilisé, les tokens d’entrée mis en cache sont facturés $0.19 par 1M de tokens au lieu de $0.95, soit une réduction de 80 % sur les coûts d’entrée pour les contextes répétés. La mise en cache est donc particulièrement efficace pour les longues sessions de codage multi-tours, les workflows de débogage itératif et tous les cas où des prompts similaires ou le contexte d’une base de code sont envoyés à plusieurs reprises.

Dois-je utiliser l’API ou une formule d’abonnement Kimi ?

Utilisez l’API si vous développez un outil personnalisé, un pipeline CI/CD ou une plateforme interne pour développeurs nécessitant un accès programmatique et un contrôle fin de la consommation de tokens. Optez pour une formule d’abonnement Kimi (à partir de $19/month) si vous voulez un accès immédiat à Kimi Code dans votre terminal et votre IDE, sans gérer de clés API ni estimer l’usage des tokens. Les formules d’abonnement incluent des crédits Kimi Code renouvelés chaque semaine ; les niveaux supérieurs débloquent davantage de crédits et une concurrence plus élevée.

Les tarifs de l’API Kimi K2.7 Code conviennent-ils à un usage à l’échelle de l’entreprise ?

Oui. Le modèle basé sur les tokens s’adapte aussi bien aux développeurs individuels qu’aux déploiements en entreprise, sans limite supérieure d’utilisation. Pour les scénarios à fort volume, le mécanisme automatique de mise en cache du contexte réduit nettement les coûts lorsque des entrées similaires sont réutilisées d’une session à l’autre. Si vous avez besoin de conditions entreprise personnalisées, d’un support dédié ou de remises sur volume, contactez l’équipe commerciale Kimi via la Kimi API Platform.