Tarifs de Kimi K2.7 Code : coûts et offres API

8 min de lecture2026-06-25
Tarifs de l’API Kimi K2.7 Code

Formules d’abonnement Kimi K2.7 Code et niveaux d’utilisation

Pour utiliser Kimi K2.7 Code directement dans votre terminal ou votre IDE, la solution la plus simple consiste à souscrire un abonnement Kimi Code.

ModeratoAllegrettoAllegroVivace
Prix mensuel$19 / mois$39 / mois$99 / mois$199 / mois
DescriptionQuotas d’utilisation renouvelés chaque semaine avec connexion multi-appareils, pour partager votre offre entre plusieurs appareils et travailler efficacement sur plusieurs projetsLimites hebdomadaires généreuses et plafonds de concurrence relevés, pour une solution très avantageuse destinée aux utilisateurs avancésQuota étendu, pensé pour l’excellence. Gère sans effort aussi bien les tâches quotidiennes que le développement intensifNos quotas hebdomadaires les plus élevés, pour mener facilement des projets complexes et de vastes bases de code

Chaque offre inclut des quotas d’utilisation renouvelés chaque semaine. Les niveaux supérieurs offrent des limites hebdomadaires plus élevées et des plafonds de concurrence accrus, ce qui les rend adaptés aux projets les plus exigeants. Pour connaître les dernières informations sur les offres, consultez la page officielle des abonnements.

Qu’est-ce qui est inclus en plus de Kimi Code ?

L’achat d’une offre Kimi Code débloque également les avantages plus larges de l’abonnement Kimi, principalement propulsés par Kimi K2.6.

AdagioModeratoAllegrettoAllegroVivace
Prix$0$19 / mois$39 / mois$99 / mois$199 / mois
Utilisation de l’Agent660150360720
Tâches Agent simultanées1 tâche2 tâches2 tâches4 tâches4 tâches
File prioritaire AgentVitesse 4xVitesse 4xVitesse 4xVitesse 4x
Agent Swarm25 utilisations incluses50 utilisations incluses120 utilisations incluses240 utilisations incluses
Sous-agents Agent Swarm simultanés2 sous-agents4 sous-agents4 sous-agents8 sous-agents
Kimi Claw
Kimi Claw Android
Kimi Claw PC
Discussion de groupe avec Claw10 discussions de groupe10 discussions de groupe10 discussions de groupe
Déployer un site web avec une base de données
Tâches planifiées actives Kimi Work2 tâches10 tâches15 tâches20 tâches20 tâches

Ces avantages transverses à plusieurs produits sont disponibles dans toutes les offres payantes en complément de votre utilisation de Kimi K2.7 Code : vous bénéficiez ainsi, dans un seul abonnement, d’un agent de codage dédié et d’un espace de travail IA complet.

Tarifs de l’API Kimi K2.7 Code

Les tarifs de l’API Kimi K2.7 Code reposent sur un modèle au token, avec une facturation par 1M de tokens (1 000 000 tokens) pour le traitement des entrées comme des sorties, afin d’offrir un contrôle des coûts clair et prévisible.

ModèleUnitéPrix en entrée (cache hit)Prix en entrée (cache miss)Prix en sortieFenêtre de contexte
kimi-k2.7-code1M de tokens$0.19$0.95$4.00262 144 tokens
kimi-k2.7-code-highspeed1M de tokens$0.38$1.90$8.00262 144 tokens

Le modèle standard kimi-k2.7-code offre les performances de codage les plus intelligentes de Kimi, avec une prise en charge complète du raisonnement à long contexte et des tâches agentiques. La variante kimi-k2.7-code-highspeed atteint une vitesse de sortie d’environ 180 Tokens/s (jusqu’à 260 Tokens/s dans les scénarios à contexte court), pour une expérience de codage extrême dans les workflows sensibles à la latence.

Fonctionnement de la facturation de l’API Kimi K2.7 Code

L’API Kimi K2.7 Code utilise, pour chaque requête, un modèle de tarification au token : chaque interaction avec le modèle consomme des tokens facturés selon leur type. Dans ce modèle, les tokens sont généralement répartis en trois catégories : tokens d’entrée, tokens de sortie et tokens d’entrée mis en cache.

Tokens d’entrée

Les tokens d’entrée correspondent à tout ce qui est envoyé au modèle, notamment :

  • Prompts utilisateur

  • Instructions système

  • Historique ou contexte de conversation

Ces tokens déterminent la quantité de contexte que le modèle doit traiter avant de générer une réponse.

Tokens d’entrée mis en cache

Les tokens d’entrée mis en cache apparaissent lorsqu’un contexte déjà traité est réutilisé.

  • Si un contexte identique ou similaire est réutilisé, il peut être servi à moindre coût

  • Cela améliore nettement l’efficacité des workflows répétitifs

  • C’est particulièrement utile dans les applications à long contexte ou les interactions à plusieurs tours

Tokens de sortie

Les tokens de sortie sont générés par le modèle en réponse à une requête. Ils correspondent au contenu effectivement produit par l’IA, par exemple :

  • Génération de code

  • Réponses textuelles

  • Sorties structurées

La génération de sortie nécessitant des calculs supplémentaires, son tarif est généralement plus élevé que celui des tokens d’entrée.

Conclusion

Kimi K2.7 Code propose une grille tarifaire transparente et flexible, adaptée aussi bien aux projets de développement individuels qu’aux charges de production à grande échelle. Grâce à la facturation au token, aux remises liées au cache et à l’option de modèle haute vitesse, les développeurs peuvent ajuster le compromis entre performances et coût selon leurs besoins. Il devient ainsi plus simple de créer, tester et déployer des workflows de codage optimisés par l’IA, tout en gardant des dépenses prévisibles.

FAQ

Comment la facturation de l’API Kimi K2.7 Code est-elle calculée ?
L’API Kimi K2.7 Code est facturée au token. Chaque requête consomme des tokens d’entrée (votre prompt et le contexte) et des tokens de sortie (la réponse générée par le modèle). Les tokens d’entrée sont facturés $0.95 par 1M de tokens en cas d’absence dans le cache, ou $0.19 par 1M de tokens en cas de cache hit. Les tokens de sortie sont facturés $4.00 par 1M de tokens pour le modèle standard, et $8.00 par 1M de tokens pour la variante haute vitesse. Tous les prix s’entendent hors taxes applicables.
Combien puis-je économiser avec la mise en cache du contexte ?
Lorsqu’un contexte déjà traité est réutilisé, les tokens d’entrée mis en cache sont facturés $0.19 par 1M de tokens au lieu de $0.95, soit une réduction de 80 % sur les coûts d’entrée pour les contextes répétés. La mise en cache est donc particulièrement efficace pour les longues sessions de codage multi-tours, les workflows de débogage itératif et tous les cas où des prompts similaires ou le contexte d’une base de code sont envoyés à plusieurs reprises.
Dois-je utiliser l’API ou une formule d’abonnement Kimi ?
Utilisez l’API si vous développez un outil personnalisé, un pipeline CI/CD ou une plateforme interne pour développeurs nécessitant un accès programmatique et un contrôle fin de la consommation de tokens. Optez pour une formule d’abonnement Kimi (à partir de $19/month) si vous voulez un accès immédiat à Kimi Code dans votre terminal et votre IDE, sans gérer de clés API ni estimer l’usage des tokens. Les formules d’abonnement incluent des crédits Kimi Code renouvelés chaque semaine ; les niveaux supérieurs débloquent davantage de crédits et une concurrence plus élevée.
Les tarifs de l’API Kimi K2.7 Code conviennent-ils à un usage à l’échelle de l’entreprise ?
Oui. Le modèle basé sur les tokens s’adapte aussi bien aux développeurs individuels qu’aux déploiements en entreprise, sans limite supérieure d’utilisation. Pour les scénarios à fort volume, le mécanisme automatique de mise en cache du contexte réduit nettement les coûts lorsque des entrées similaires sont réutilisées d’une session à l’autre. Si vous avez besoin de conditions entreprise personnalisées, d’un support dédié ou de remises sur volume, contactez l’équipe commerciale Kimi via la Kimi API Platform.