¿Qué es Kimi K2.7 Code?
Kimi K2.7 Code es un modelo agentic de código abierto enfocado en programación, desarrollado por Moonshot AI. Ofrece un desempeño superior en programación y Agent, con mejoras sustanciales en tareas reales de programación de largo horizonte. Estas mejoras se traducen en tasas más altas de éxito de extremo a extremo en flujos complejos de ingeniería de software. K2.7 Code también mejora la eficiencia del razonamiento y reduce el uso de tokens de razonamiento en aproximadamente un 30% frente a K2.6.
Rendimiento en benchmarks
Kimi K2.7 Code se evaluó frente a K2.6 con una combinación de benchmarks internos y externos que cubren dos dimensiones: capacidad de programación y ejecución de tareas agentic.
En los benchmarks de programación, K2.7 Code muestra avances sustanciales frente a K2.6: +21.8% en Kimi Code Bench v2 (62.0 vs 50.9), +11.0% en Program Bench (53.6 vs 48.3) y +31.5% en MLS Bench Lite (35.1 vs 26.7).
Una mayor capacidad de programación también se traduce en un desempeño agentic superior. En Kimi Claw 24/7 Bench, MCP Atlas y MCP Mark Verified —benchmarks que miden la ejecución autónoma de tareas por Agent—, K2.7 Code mejora alrededor de un 10% frente a K2.6.
Programación:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentic:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
Kimi Code Bench v2 es un benchmark interno desarrollado por Moonshot AI, y Kimi Claw 24/7 Bench es un benchmark interno para evaluación agentic. Kimi K2.7 Code y K2.6 se probaron mediante Kimi Code CLI con el razonamiento activado (temperatura 1.0, top-p 0.95, contexto de 262,144 tokens), mientras que GPT-5.5 se evaluó en Codex (xhigh) y Opus 4.8 en Claude Code (xhigh). Las excepciones por benchmark y la metodología completa se detallan en la tarjeta del modelo en Hugging Face.
Creado para programación de largo horizonte
La ingeniería de software del mundo real rara vez termina en un solo paso. Tareas como refactorizar una base de código, implementar una función en varios archivos o depurar durante sesiones largas con Agent exigen que el modelo siga instrucciones de forma confiable en contextos extensos y lleve la tarea hasta completarla.
Kimi K2.7 Code está optimizado para estos escenarios de largo horizonte. En comparación con K2.6, sigue instrucciones con mayor confiabilidad en contextos largos y logra tasas más altas de éxito de extremo a extremo, por lo que se adapta mejor a flujos complejos de ingeniería de software.
Eficiencia de razonamiento optimizada
Los modelos de razonamiento tienden a pensar de más y gastan miles de tokens deliberando sobre problemas que no lo requieren. Kimi K2.7 Code reduce significativamente esta tendencia: disminuye el uso de tokens de razonamiento en aproximadamente un 30% en promedio frente a K2.6.
En Kimi Code Bench v2, Program Bench y MLS Bench Lite, Kimi K2.7 Code obtiene puntajes más altos que K2.6 y consume menos tokens en cada benchmark.
Para los desarrolladores, esta eficiencia se acumula en cada tarea: respuestas más rápidas en sesiones interactivas de programación, menores costos de API en producción y flujos de Agent que completan más trabajo con el mismo presupuesto de contexto.
Arquitectura del modelo
Kimi K2.7 Code está construido sobre una arquitectura Mixture-of-Experts (MoE) con 1 billón de parámetros totales y 32 mil millones de parámetros activados por token. El modelo admite una longitud de contexto de 256K y utiliza Multi-head Latent Attention (MLA). También incluye MoonViT, un codificador de visión de 400M parámetros.
| Parámetro | Valor |
|---|---|
| Arquitectura | Mixture-of-Experts (MoE) |
| Parámetros totales | 1T |
| Parámetros activados | 32B |
| Número de capas (incluye capa densa) | 61 |
| Número de capas densas | 1 |
| Dimensión oculta de atención | 7168 |
| Dimensión oculta MoE (por experto) | 2048 |
| Número de cabezales de atención | 64 |
| Número de expertos | 384 |
| Expertos seleccionados por token | 8 |
| Número de expertos compartidos | 1 |
| Tamaño del vocabulario | 160K |
| Longitud de contexto | 256K |
| Mecanismo de atención | MLA |
| Función de activación | SwiGLU |
| Codificador de visión | MoonViT |
| Parámetros del codificador de visión | 400M |
Los pesos completos del modelo son de código abierto y están disponibles en Hugging Face.
Cómo elegir entre Kimi K2.7 Code y K2.6
Kimi K2.7 Code está diseñado específicamente para tareas de programación. Para trabajo de propósito general, como redacción, análisis y conversación, recomendamos K2.6, que ofrece capacidades más equilibradas.
Cómo acceder a Kimi K2.7 Code
Dónde usarlo
Kimi K2.7 Code está disponible a través de:
Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code ahora es el modelo predeterminado, con el modo de razonamiento activado por defecto. Para comenzar, sigue las instrucciones de configuración de la página.
Kimi API en la plataforma abierta (https://platform.kimi.ai/). Los desarrolladores pueden llamar a Kimi K2.7 Code mediante la Kimi API e integrarlo en sus propios flujos de programación, agents y herramientas para desarrolladores.
Requisito del modo de razonamiento
Kimi K2.7 Code no admite el modo sin razonamiento. Siempre se ejecuta con el razonamiento activado, tanto en la Kimi API como en Kimi Code. En Kimi Code, las solicitudes realizadas con el razonamiento desactivado se atienden automáticamente con K2.6.
Precios de Kimi K2.7 Code
Planes de Kimi Code
Si quieres probar Kimi K2.7 Code directamente desde Kimi Code, incluidos los plugins de terminal e IDE, puedes elegir nuestros planes Code. Los precios que se muestran a continuación son mensuales con facturación anual:
| Plan | Precio | Ideal para |
|---|---|---|
| Moderato | $15 / mes | Usuarios que necesitan cuotas de uso renovadas semanalmente y acceso multidispositivo para flujos habituales de programación |
| Allegretto | $31 / mes | Usuarios avanzados que necesitan límites semanales más amplios y mayores topes de concurrencia |
| Allegro | $79 / mes | Usuarios que trabajan en tareas de desarrollo intensivas, proyectos complejos y cargas de trabajo mayores |
| Vivace | $159 / mes | Usuarios que necesitan las cuotas semanales más altas del plan para proyectos complejos y bases de código grandes |
Cada plan incluye límites de uso renovados semanalmente. Los planes de nivel superior ofrecen límites semanales más amplios y mayores topes de concurrencia, por lo que son adecuados para proyectos más complejos.Para ver los detalles más recientes de los planes, consulta la página oficial de membresía.
Precios de Kimi API
Kimi K2.7 Code está disponible a través de la Kimi API con facturación por uso, por token:
| Modelo | Unidad | Precio de entrada (acierto de caché) | Precio de entrada (fallo de caché) | Precio de salida | Ventana de contexto |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M tokens | $0.19 | $0.95 | $4.00 | 262,144 tokens |
La API admite almacenamiento automático en caché de contexto, lo que reduce el costo de entrada para contextos reutilizados (acierto de caché $0.19 vs fallo de caché $0.95 por millón de tokens). Los precios no incluyen los impuestos aplicables. Consulta la documentación oficial de precios para ver las tarifas más recientes.