Kimi K2.7 Code

Un modelo agentic de código abierto, enfocado en programación y creado para ingeniería de software de largo horizonte

8 min. de lectura2026-06-18
Kimi K2.7 Code

¿Qué es Kimi K2.7 Code?

Kimi K2.7 Code es un modelo agentic de código abierto enfocado en programación, desarrollado por Moonshot AI. Ofrece un desempeño superior en programación y Agent, con mejoras sustanciales en tareas reales de programación de largo horizonte. Estas mejoras se traducen en tasas más altas de éxito de extremo a extremo en flujos complejos de ingeniería de software. K2.7 Code también mejora la eficiencia del razonamiento y reduce el uso de tokens de razonamiento en aproximadamente un 30% frente a K2.6.

Rendimiento en benchmarks

Kimi K2.7 Code se evaluó frente a K2.6 con una combinación de benchmarks internos y externos que cubren dos dimensiones: capacidad de programación y ejecución de tareas agentic.

Comparación de benchmarks de Kimi K2.7 Code, Kimi K2.6, GPT-5.5 y Claude Opus 4.8 en seis benchmarks de programación y agentic

En los benchmarks de programación, K2.7 Code muestra avances sustanciales frente a K2.6: +21.8% en Kimi Code Bench v2 (62.0 vs 50.9), +11.0% en Program Bench (53.6 vs 48.3) y +31.5% en MLS Bench Lite (35.1 vs 26.7).

Una mayor capacidad de programación también se traduce en un desempeño agentic superior. En Kimi Claw 24/7 Bench, MCP Atlas y MCP Mark Verified —benchmarks que miden la ejecución autónoma de tareas por Agent—, K2.7 Code mejora alrededor de un 10% frente a K2.6.

  • Programación:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
Program Bench48.353.669.163.8
MLS Bench Lite26.735.135.542.8
  • Agentic:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Claw 24/7 Bench42.946.952.850.4
MCP Atlas69.476.079.481.3
MCP Mark Verified72.881.192.976.4

Kimi Code Bench v2 es un benchmark interno desarrollado por Moonshot AI, y Kimi Claw 24/7 Bench es un benchmark interno para evaluación agentic. Kimi K2.7 Code y K2.6 se probaron mediante Kimi Code CLI con el razonamiento activado (temperatura 1.0, top-p 0.95, contexto de 262,144 tokens), mientras que GPT-5.5 se evaluó en Codex (xhigh) y Opus 4.8 en Claude Code (xhigh). Las excepciones por benchmark y la metodología completa se detallan en la tarjeta del modelo en Hugging Face.

Creado para programación de largo horizonte

La ingeniería de software del mundo real rara vez termina en un solo paso. Tareas como refactorizar una base de código, implementar una función en varios archivos o depurar durante sesiones largas con Agent exigen que el modelo siga instrucciones de forma confiable en contextos extensos y lleve la tarea hasta completarla.

Kimi K2.7 Code está optimizado para estos escenarios de largo horizonte. En comparación con K2.6, sigue instrucciones con mayor confiabilidad en contextos largos y logra tasas más altas de éxito de extremo a extremo, por lo que se adapta mejor a flujos complejos de ingeniería de software.

Eficiencia de razonamiento optimizada

Los modelos de razonamiento tienden a pensar de más y gastan miles de tokens deliberando sobre problemas que no lo requieren. Kimi K2.7 Code reduce significativamente esta tendencia: disminuye el uso de tokens de razonamiento en aproximadamente un 30% en promedio frente a K2.6.

En Kimi Code Bench v2, Program Bench y MLS Bench Lite, Kimi K2.7 Code obtiene puntajes más altos que K2.6 y consume menos tokens en cada benchmark.

Rendimiento vs tokens de Kimi K2.7 Code

Para los desarrolladores, esta eficiencia se acumula en cada tarea: respuestas más rápidas en sesiones interactivas de programación, menores costos de API en producción y flujos de Agent que completan más trabajo con el mismo presupuesto de contexto.

Arquitectura del modelo

Kimi K2.7 Code está construido sobre una arquitectura Mixture-of-Experts (MoE) con 1 billón de parámetros totales y 32 mil millones de parámetros activados por token. El modelo admite una longitud de contexto de 256K y utiliza Multi-head Latent Attention (MLA). También incluye MoonViT, un codificador de visión de 400M parámetros.

ParámetroValor
ArquitecturaMixture-of-Experts (MoE)
Parámetros totales1T
Parámetros activados32B
Número de capas (incluye capa densa)61
Número de capas densas1
Dimensión oculta de atención7168
Dimensión oculta MoE (por experto)2048
Número de cabezales de atención64
Número de expertos384
Expertos seleccionados por token8
Número de expertos compartidos1
Tamaño del vocabulario160K
Longitud de contexto256K
Mecanismo de atenciónMLA
Función de activaciónSwiGLU
Codificador de visiónMoonViT
Parámetros del codificador de visión400M

Los pesos completos del modelo son de código abierto y están disponibles en Hugging Face.

Cómo elegir entre Kimi K2.7 Code y K2.6

Kimi K2.7 Code está diseñado específicamente para tareas de programación. Para trabajo de propósito general, como redacción, análisis y conversación, recomendamos K2.6, que ofrece capacidades más equilibradas.

Cómo acceder a Kimi K2.7 Code

Dónde usarlo

Kimi K2.7 Code está disponible a través de:

  • Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code ahora es el modelo predeterminado, con el modo de razonamiento activado por defecto. Para comenzar, sigue las instrucciones de configuración de la página.

    interfaz de Kimi Code
  • Kimi API en la plataforma abierta (https://platform.kimi.ai/). Los desarrolladores pueden llamar a Kimi K2.7 Code mediante la Kimi API e integrarlo en sus propios flujos de programación, agents y herramientas para desarrolladores.

Requisito del modo de razonamiento

Kimi K2.7 Code no admite el modo sin razonamiento. Siempre se ejecuta con el razonamiento activado, tanto en la Kimi API como en Kimi Code. En Kimi Code, las solicitudes realizadas con el razonamiento desactivado se atienden automáticamente con K2.6.

Precios de Kimi K2.7 Code

Planes de Kimi Code

Si quieres probar Kimi K2.7 Code directamente desde Kimi Code, incluidos los plugins de terminal e IDE, puedes elegir nuestros planes Code. Los precios que se muestran a continuación son mensuales con facturación anual:

PlanPrecioIdeal para
Moderato$15 / mesUsuarios que necesitan cuotas de uso renovadas semanalmente y acceso multidispositivo para flujos habituales de programación
Allegretto$31 / mesUsuarios avanzados que necesitan límites semanales más amplios y mayores topes de concurrencia
Allegro$79 / mesUsuarios que trabajan en tareas de desarrollo intensivas, proyectos complejos y cargas de trabajo mayores
Vivace$159 / mesUsuarios que necesitan las cuotas semanales más altas del plan para proyectos complejos y bases de código grandes

Cada plan incluye límites de uso renovados semanalmente. Los planes de nivel superior ofrecen límites semanales más amplios y mayores topes de concurrencia, por lo que son adecuados para proyectos más complejos.Para ver los detalles más recientes de los planes, consulta la página oficial de membresía.

Precios de Kimi API

Kimi K2.7 Code está disponible a través de la Kimi API con facturación por uso, por token:

ModeloUnidadPrecio de entrada (acierto de caché)Precio de entrada (fallo de caché)Precio de salidaVentana de contexto
kimi-k2.7-code1M tokens$0.19$0.95$4.00262,144 tokens

La API admite almacenamiento automático en caché de contexto, lo que reduce el costo de entrada para contextos reutilizados (acierto de caché $0.19 vs fallo de caché $0.95 por millón de tokens). Los precios no incluyen los impuestos aplicables. Consulta la documentación oficial de precios para ver las tarifas más recientes.

Preguntas frecuentes

¿Kimi K2.7 Code es de código abierto?
Sí. Los pesos del modelo son de código abierto y están disponibles para descargarse en Hugging Face, donde también encontrarás guías de implementación y la documentación completa.
¿Cuál es la ventana de contexto de Kimi K2.7 Code?
Kimi K2.7 Code admite una ventana de contexto de 256K (262,144 tokens), por lo que resulta ideal para bases de código a escala de repositorio y sesiones largas de programación con múltiples turnos.
¿Kimi K2.7 Code admite entradas de imagen y video?
Sí. Kimi K2.7 Code usa una arquitectura multimodal nativa compatible con entradas de texto, imagen y video, además de sus capacidades de programación y agentic.
¿Se requiere el modo de razonamiento para usar Kimi K2.7 Code?
Sí. Kimi K2.7 Code no admite el modo sin razonamiento y siempre se ejecuta con el razonamiento activado. En Kimi Code, las solicitudes realizadas con el razonamiento desactivado se atienden automáticamente con K2.6.