Kimi K2.7 Code

Un modèle agentique open source axé sur le code, conçu pour l’ingénierie logicielle au long cours

8 min de lecture2026-06-18

Qu’est-ce que Kimi K2.7 Code ?

Kimi K2.7 Code est un modèle agentique open source axé sur le code, développé par Moonshot AI. Il offre de meilleures performances en codage et en Agent, avec des améliorations substantielles sur les tâches de codage réelles au long cours. Ces progrès se traduisent par des taux de réussite de bout en bout plus élevés dans des workflows d’ingénierie logicielle complexes. K2.7 Code améliore également l’efficacité du raisonnement, en réduisant l’utilisation des tokens de réflexion d’environ 30 % par rapport à K2.6.

Performances sur les benchmarks

Kimi K2.7 Code a été évalué par rapport à K2.6 sur un ensemble de benchmarks internes et externes couvrant deux dimensions : les capacités de codage et l’exécution de tâches agentiques.

Comparaison des benchmarks de Kimi K2.7 Code, Kimi K2.6, GPT-5.5 et Claude Opus 4.8 sur six benchmarks de codage et agentiques

Sur les benchmarks de codage, K2.7 Code affiche des gains substantiels par rapport à K2.6 : +21,8 % sur Kimi Code Bench v2 (62,0 contre 50,9), +11,0 % sur Program Bench (53,6 contre 48,3) et +31,5 % sur MLS Bench Lite (35,1 contre 26,7).

Des capacités de codage renforcées se traduisent aussi par de meilleures performances agentiques. Sur Kimi Claw 24/7 Bench, MCP Atlas et MCP Mark Verified — des benchmarks qui mesurent l’exécution autonome de tâches par agent — K2.7 Code progresse d’environ 10 % par rapport à K2.6.

Codage :

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentique :

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

Kimi Code Bench v2 est un benchmark interne développé par Moonshot AI, et Kimi Claw 24/7 Bench est un benchmark interne destiné à l’évaluation agentique. Kimi K2.7 Code et K2.6 ont été testés via Kimi Code CLI avec la réflexion activée (température 1,0, top-p 0,95, contexte de 262 144 tokens), tandis que GPT-5.5 a été évalué dans Codex (xhigh) et Opus 4.8 dans Claude Code (xhigh). Les exceptions propres à chaque benchmark et la méthodologie complète sont détaillées dans la fiche du modèle Hugging Face.

Conçu pour le codage au long cours

Dans le monde réel, l’ingénierie logicielle se résume rarement à une seule étape. Refondre une base de code, implémenter une fonctionnalité dans plusieurs fichiers ou déboguer au fil de longues sessions d’agent exige d’un modèle qu’il suive les instructions de manière fiable dans des contextes étendus et qu’il mène la tâche à son terme.

Kimi K2.7 Code est optimisé pour ces scénarios au long cours. Par rapport à K2.6, il suit les instructions de façon plus fiable dans les contextes longs et atteint des taux de réussite de bout en bout plus élevés, ce qui le rend mieux adapté aux workflows complexes d’ingénierie logicielle.

Essayer dans Kimi Code

Efficacité du raisonnement optimisée

Les modèles de raisonnement ont tendance à trop réfléchir, dépensant des milliers de tokens à délibérer sur des problèmes qui ne l’exigent pas. Kimi K2.7 Code réduit nettement cette tendance : il diminue l’utilisation des tokens de réflexion d’environ 30 % en moyenne par rapport à K2.6.

Sur Kimi Code Bench v2, Program Bench et MLS Bench Lite, Kimi K2.7 Code obtient de meilleurs scores que K2.6 tout en consommant moins de tokens sur chaque benchmark.

Performances vs tokens de Kimi K2.7 Code

Pour les développeurs, cette efficacité se cumule à chaque tâche : réponses plus rapides lors des sessions de codage interactives, coûts d’API réduits en production et workflows d’agent capables d’accomplir davantage dans le même budget de contexte.

Essayer dans Kimi Code

Architecture du modèle

Kimi K2.7 Code repose sur une architecture Mixture-of-Experts (MoE) avec 1 billion de paramètres au total et 32 milliards de paramètres activés par token. Le modèle prend en charge une longueur de contexte de 256K et utilise la Multi-head Latent Attention (MLA). Il intègre également MoonViT, un encodeur visuel de 400M paramètres.

Paramètre	Valeur
Architecture	Mixture-of-Experts (MoE)
Paramètres totaux	1T
Paramètres activés	32B
Nombre de couches (couche dense incluse)	61
Nombre de couches denses	1
Dimension cachée de l’attention	7168
Dimension cachée MoE (par Expert)	2048
Nombre de têtes d’attention	64
Nombre d’Experts	384
Experts sélectionnés par token	8
Nombre d’Experts partagés	1
Taille du vocabulaire	160K
Longueur de contexte	256K
Mécanisme d’attention	MLA
Fonction d’activation	SwiGLU
Encodeur visuel	MoonViT
Paramètres de l’encodeur visuel	400M

Les poids complets du modèle sont open source et disponibles sur Hugging Face.

Choisir entre Kimi K2.7 Code et K2.6

Kimi K2.7 Code est spécialement conçu pour les tâches de codage. Pour les usages généralistes comme la rédaction, l’analyse et la conversation, nous recommandons K2.6, dont les capacités sont plus polyvalentes.

Comment accéder à Kimi K2.7 Code

Où l’utiliser

Kimi K2.7 Code est disponible via :

Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code est désormais le modèle par défaut, avec le mode de réflexion activé par défaut. Pour commencer, suivez les instructions de configuration indiquées sur la page.
Kimi API sur la plateforme ouverte (https://platform.kimi.ai/). Les développeurs peuvent appeler Kimi K2.7 Code via la Kimi API et l’intégrer à leurs propres workflows de codage, agents et outils de développement.

Mode de réflexion requis

Kimi K2.7 Code ne prend pas en charge le mode sans réflexion. Il fonctionne toujours avec la réflexion activée, aussi bien avec la Kimi API qu’avec Kimi Code. Dans Kimi Code, les requêtes envoyées avec la réflexion désactivée sont automatiquement traitées par K2.6 à la place.

Tarifs de Kimi K2.7 Code

Offres Kimi Code

Pour découvrir Kimi K2.7 Code directement dans Kimi Code, y compris via le terminal et les plugins d’IDE, vous pouvez choisir nos offres Code. Les prix indiqués ci-dessous sont des tarifs mensuels avec facturation annuelle :

Offre	Prix	Idéal pour
Moderato	15 $ / mois	Les utilisateurs qui ont besoin de quotas d’utilisation renouvelés chaque semaine et d’un accès multi-appareil pour des workflows de codage réguliers
Allegretto	31 $ / mois	Les utilisateurs avancés qui ont besoin de limites hebdomadaires plus élevées et de plafonds de concurrence accrus
Allegro	79 $ / mois	Les utilisateurs travaillant sur des tâches de développement intensives, des projets complexes et des charges de travail plus importantes
Vivace	159 $ / mois	Les utilisateurs qui ont besoin des quotas hebdomadaires les plus élevés pour des projets complexes et de grandes bases de code

Chaque offre inclut des limites d’utilisation renouvelées chaque semaine. Les offres supérieures proposent des limites hebdomadaires plus élevées et des plafonds de concurrence accrus, ce qui les rend adaptées aux projets plus complexes.Pour obtenir les derniers détails sur les offres, consultez la page officielle des abonnements.

Tarifs de Kimi API

Kimi K2.7 Code est disponible via la Kimi API avec une facturation à l’usage, par token :

Modèle	Unité	Prix d’entrée (cache touché)	Prix d’entrée (cache manqué)	Prix de sortie	Fenêtre de contexte
kimi-k2.7-code	1M tokens	$0.19	$0.95	$4.00	262,144 tokens

L’API prend en charge la mise en cache automatique du contexte, ce qui réduit le coût d’entrée pour les contextes réutilisés (cache touché $0.19 contre cache manqué $0.95 par million de tokens). Les prix s’entendent hors taxes applicables. Consultez la documentation officielle des tarifs pour connaître les derniers tarifs.

FAQ

Kimi K2.7 Code est-il open source ?

Oui. Les poids du modèle sont open source et disponibles au téléchargement sur Hugging Face, où vous trouverez également des guides de déploiement et la documentation complète.

Quelle est la fenêtre de contexte de Kimi K2.7 Code ?

Kimi K2.7 Code prend en charge une fenêtre de contexte de 256K (262 144 tokens), ce qui le rend particulièrement adapté aux bases de code à l’échelle d’un dépôt et aux longues sessions de codage en plusieurs tours.

Kimi K2.7 Code prend-il en charge les entrées image et vidéo ?

Oui. Kimi K2.7 Code repose sur une architecture nativement multimodale qui prend en charge les entrées texte, image et vidéo, en plus de ses capacités de codage et agentiques.

Le mode réflexion est-il nécessaire pour utiliser Kimi K2.7 Code ?

Oui. Kimi K2.7 Code ne prend pas en charge le mode sans réflexion et fonctionne toujours avec la réflexion activée. Dans Kimi Code, les requêtes effectuées avec la réflexion désactivée sont automatiquement servies par K2.6 à la place.