Qu’est-ce que Kimi K2.7 Code ?
Kimi K2.7 Code est un modèle agentique open source axé sur le code, développé par Moonshot AI. Il offre de meilleures performances en codage et en Agent, avec des améliorations substantielles sur les tâches de codage réelles au long cours. Ces progrès se traduisent par des taux de réussite de bout en bout plus élevés dans des workflows d’ingénierie logicielle complexes. K2.7 Code améliore également l’efficacité du raisonnement, en réduisant l’utilisation des tokens de réflexion d’environ 30 % par rapport à K2.6.
Performances sur les benchmarks
Kimi K2.7 Code a été évalué par rapport à K2.6 sur un ensemble de benchmarks internes et externes couvrant deux dimensions : les capacités de codage et l’exécution de tâches agentiques.
Sur les benchmarks de codage, K2.7 Code affiche des gains substantiels par rapport à K2.6 : +21,8 % sur Kimi Code Bench v2 (62,0 contre 50,9), +11,0 % sur Program Bench (53,6 contre 48,3) et +31,5 % sur MLS Bench Lite (35,1 contre 26,7).
Des capacités de codage renforcées se traduisent aussi par de meilleures performances agentiques. Sur Kimi Claw 24/7 Bench, MCP Atlas et MCP Mark Verified — des benchmarks qui mesurent l’exécution autonome de tâches par agent — K2.7 Code progresse d’environ 10 % par rapport à K2.6.
Codage :
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentique :
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
Kimi Code Bench v2 est un benchmark interne développé par Moonshot AI, et Kimi Claw 24/7 Bench est un benchmark interne destiné à l’évaluation agentique. Kimi K2.7 Code et K2.6 ont été testés via Kimi Code CLI avec la réflexion activée (température 1,0, top-p 0,95, contexte de 262 144 tokens), tandis que GPT-5.5 a été évalué dans Codex (xhigh) et Opus 4.8 dans Claude Code (xhigh). Les exceptions propres à chaque benchmark et la méthodologie complète sont détaillées dans la fiche du modèle Hugging Face.
Conçu pour le codage au long cours
Dans le monde réel, l’ingénierie logicielle se résume rarement à une seule étape. Refondre une base de code, implémenter une fonctionnalité dans plusieurs fichiers ou déboguer au fil de longues sessions d’agent exige d’un modèle qu’il suive les instructions de manière fiable dans des contextes étendus et qu’il mène la tâche à son terme.
Kimi K2.7 Code est optimisé pour ces scénarios au long cours. Par rapport à K2.6, il suit les instructions de façon plus fiable dans les contextes longs et atteint des taux de réussite de bout en bout plus élevés, ce qui le rend mieux adapté aux workflows complexes d’ingénierie logicielle.
Efficacité du raisonnement optimisée
Les modèles de raisonnement ont tendance à trop réfléchir, dépensant des milliers de tokens à délibérer sur des problèmes qui ne l’exigent pas. Kimi K2.7 Code réduit nettement cette tendance : il diminue l’utilisation des tokens de réflexion d’environ 30 % en moyenne par rapport à K2.6.
Sur Kimi Code Bench v2, Program Bench et MLS Bench Lite, Kimi K2.7 Code obtient de meilleurs scores que K2.6 tout en consommant moins de tokens sur chaque benchmark.
Pour les développeurs, cette efficacité se cumule à chaque tâche : réponses plus rapides lors des sessions de codage interactives, coûts d’API réduits en production et workflows d’agent capables d’accomplir davantage dans le même budget de contexte.
Architecture du modèle
Kimi K2.7 Code repose sur une architecture Mixture-of-Experts (MoE) avec 1 billion de paramètres au total et 32 milliards de paramètres activés par token. Le modèle prend en charge une longueur de contexte de 256K et utilise la Multi-head Latent Attention (MLA). Il intègre également MoonViT, un encodeur visuel de 400M paramètres.
| Paramètre | Valeur |
|---|---|
| Architecture | Mixture-of-Experts (MoE) |
| Paramètres totaux | 1T |
| Paramètres activés | 32B |
| Nombre de couches (couche dense incluse) | 61 |
| Nombre de couches denses | 1 |
| Dimension cachée de l’attention | 7168 |
| Dimension cachée MoE (par Expert) | 2048 |
| Nombre de têtes d’attention | 64 |
| Nombre d’Experts | 384 |
| Experts sélectionnés par token | 8 |
| Nombre d’Experts partagés | 1 |
| Taille du vocabulaire | 160K |
| Longueur de contexte | 256K |
| Mécanisme d’attention | MLA |
| Fonction d’activation | SwiGLU |
| Encodeur visuel | MoonViT |
| Paramètres de l’encodeur visuel | 400M |
Les poids complets du modèle sont open source et disponibles sur Hugging Face.
Choisir entre Kimi K2.7 Code et K2.6
Kimi K2.7 Code est spécialement conçu pour les tâches de codage. Pour les usages généralistes comme la rédaction, l’analyse et la conversation, nous recommandons K2.6, dont les capacités sont plus polyvalentes.
Comment accéder à Kimi K2.7 Code
Où l’utiliser
Kimi K2.7 Code est disponible via :
Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code est désormais le modèle par défaut, avec le mode de réflexion activé par défaut. Pour commencer, suivez les instructions de configuration indiquées sur la page.
Kimi API sur la plateforme ouverte (https://platform.kimi.ai/). Les développeurs peuvent appeler Kimi K2.7 Code via la Kimi API et l’intégrer à leurs propres workflows de codage, agents et outils de développement.
Mode de réflexion requis
Kimi K2.7 Code ne prend pas en charge le mode sans réflexion. Il fonctionne toujours avec la réflexion activée, aussi bien avec la Kimi API qu’avec Kimi Code. Dans Kimi Code, les requêtes envoyées avec la réflexion désactivée sont automatiquement traitées par K2.6 à la place.
Tarifs de Kimi K2.7 Code
Offres Kimi Code
Pour découvrir Kimi K2.7 Code directement dans Kimi Code, y compris via le terminal et les plugins d’IDE, vous pouvez choisir nos offres Code. Les prix indiqués ci-dessous sont des tarifs mensuels avec facturation annuelle :
| Offre | Prix | Idéal pour |
|---|---|---|
| Moderato | 15 $ / mois | Les utilisateurs qui ont besoin de quotas d’utilisation renouvelés chaque semaine et d’un accès multi-appareil pour des workflows de codage réguliers |
| Allegretto | 31 $ / mois | Les utilisateurs avancés qui ont besoin de limites hebdomadaires plus élevées et de plafonds de concurrence accrus |
| Allegro | 79 $ / mois | Les utilisateurs travaillant sur des tâches de développement intensives, des projets complexes et des charges de travail plus importantes |
| Vivace | 159 $ / mois | Les utilisateurs qui ont besoin des quotas hebdomadaires les plus élevés pour des projets complexes et de grandes bases de code |
Chaque offre inclut des limites d’utilisation renouvelées chaque semaine. Les offres supérieures proposent des limites hebdomadaires plus élevées et des plafonds de concurrence accrus, ce qui les rend adaptées aux projets plus complexes.Pour obtenir les derniers détails sur les offres, consultez la page officielle des abonnements.
Tarifs de Kimi API
Kimi K2.7 Code est disponible via la Kimi API avec une facturation à l’usage, par token :
| Modèle | Unité | Prix d’entrée (cache touché) | Prix d’entrée (cache manqué) | Prix de sortie | Fenêtre de contexte |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M tokens | $0.19 | $0.95 | $4.00 | 262,144 tokens |
L’API prend en charge la mise en cache automatique du contexte, ce qui réduit le coût d’entrée pour les contextes réutilisés (cache touché $0.19 contre cache manqué $0.95 par million de tokens). Les prix s’entendent hors taxes applicables. Consultez la documentation officielle des tarifs pour connaître les derniers tarifs.