O que é o Kimi K2.7 Code?
Kimi K2.7 Code é um modelo agentic de código aberto, voltado para programação, desenvolvido pela Moonshot AI. Ele oferece desempenho superior em programação e em agent, com avanços substanciais em tarefas reais de programação de longo horizonte. Esses ganhos se traduzem em taxas mais altas de conclusão ponta a ponta em fluxos complexos de engenharia de software. O K2.7 Code também melhora a eficiência do raciocínio, reduzindo o uso de thinking tokens em aproximadamente 30% em comparação com o K2.6.
Desempenho em benchmarks
O Kimi K2.7 Code foi avaliado em comparação com o K2.6 usando uma combinação de benchmarks internos e externos que cobrem duas dimensões: capacidade de programação e execução de tarefas agentic.
Nos benchmarks de programação, o K2.7 Code apresenta ganhos substanciais sobre o K2.6: +21,8% no Kimi Code Bench v2 (62,0 vs 50,9), +11,0% no Program Bench (53,6 vs 48,3) e +31,5% no MLS Bench Lite (35,1 vs 26,7).
Uma capacidade de programação mais forte também se traduz em melhor desempenho agentic. No Kimi Claw 24/7 Bench, no MCP Atlas e no MCP Mark Verified — benchmarks que medem a execução autônoma de tarefas por agent —, o K2.7 Code melhora cerca de 10% em relação ao K2.6.
Programação:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentic:
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
O Kimi Code Bench v2 é um benchmark interno desenvolvido pela Moonshot AI, e o Kimi Claw 24/7 Bench é um benchmark interno para avaliação agentic. O Kimi K2.7 Code e o K2.6 foram testados via Kimi Code CLI com pensamento ativado (temperatura 1.0, top-p 0.95, contexto de 262.144 tokens), enquanto o GPT-5.5 foi avaliado no Codex (xhigh) e o Opus 4.8 no Claude Code (xhigh). As exceções por benchmark e a metodologia completa estão detalhadas no cartão do modelo no Hugging Face.
Criado para programação de longo horizonte
A engenharia de software no mundo real raramente se resolve em uma única etapa. Tarefas como refatorar uma base de código, implementar um recurso em vários arquivos ou depurar durante longas sessões com agent exigem que o modelo siga instruções de forma confiável em contextos extensos e leve a tarefa até a conclusão.
O Kimi K2.7 Code é otimizado para esses cenários de longo horizonte. Em comparação com o K2.6, ele segue instruções com mais confiabilidade em contextos longos e alcança taxas mais altas de sucesso ponta a ponta, sendo mais adequado para fluxos complexos de engenharia de software.
Eficiência de raciocínio otimizada
Modelos de raciocínio tendem a pensar demais, gastando milhares de tokens deliberando sobre problemas que não exigem isso. O Kimi K2.7 Code reduz significativamente essa tendência: em média, corta em aproximadamente 30% o uso de thinking tokens em comparação com o K2.6.
No Kimi Code Bench v2, no Program Bench e no MLS Bench Lite, o Kimi K2.7 Code alcança pontuações maiores que o K2.6 consumindo menos tokens em cada benchmark.
Para desenvolvedores, essa eficiência se multiplica a cada tarefa: respostas mais rápidas em sessões interativas de programação, custos menores de API em produção e fluxos de trabalho com agent que concluem mais trabalho dentro do mesmo orçamento de contexto.
Arquitetura do modelo
O Kimi K2.7 Code é construído sobre uma arquitetura Mixture-of-Experts (MoE), com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados por token. O modelo oferece suporte a um comprimento de contexto de 256K e usa Multi-head Latent Attention (MLA). Também inclui o MoonViT, um codificador de visão com 400M parâmetros.
| Parâmetro | Valor |
|---|---|
| Arquitetura | Mixture-of-Experts (MoE) |
| Parâmetros totais | 1T |
| Parâmetros ativados | 32B |
| Número de camadas (incluindo camada densa) | 61 |
| Número de camadas densas | 1 |
| Dimensão oculta de atenção | 7168 |
| Dimensão oculta do MoE (por Expert) | 2048 |
| Número de cabeças de atenção | 64 |
| Número de Experts | 384 |
| Experts selecionados por token | 8 |
| Número de Experts compartilhados | 1 |
| Tamanho do vocabulário | 160K |
| Comprimento do contexto | 256K |
| Mecanismo de atenção | MLA |
| Função de ativação | SwiGLU |
| Codificador de visão | MoonViT |
| Parâmetros do codificador de visão | 400M |
Os pesos completos do modelo são de código aberto e estão disponíveis no Hugging Face.
Como escolher entre Kimi K2.7 Code e K2.6
O Kimi K2.7 Code foi criado especificamente para tarefas de programação. Para trabalhos de uso geral, como escrita, análise e conversa, recomendamos o K2.6, que oferece recursos mais equilibrados.
Como acessar o Kimi K2.7 Code
Onde usar
O Kimi K2.7 Code está disponível por meio de:
Kimi Code (https://www.kimi.com/code). O Kimi K2.7 Code agora é o modelo padrão, com o modo de pensamento ativado por padrão. Para começar, siga as instruções de configuração na página.
Kimi API na plataforma aberta (https://platform.kimi.ai/). Desenvolvedores podem chamar o Kimi K2.7 Code via Kimi API e integrá-lo a seus próprios fluxos de programação, agents e ferramentas de desenvolvimento.
Obrigatoriedade do modo de pensamento
O Kimi K2.7 Code não oferece suporte ao modo sem pensamento. Ele sempre é executado com o pensamento ativado, tanto na Kimi API quanto no Kimi Code. No Kimi Code, solicitações feitas com o pensamento desativado são atendidas automaticamente pelo K2.6.
Preços do Kimi K2.7 Code
Planos Kimi Code
Para usuários que desejam experimentar o Kimi K2.7 Code diretamente pelo Kimi Code, incluindo plugins de terminal e IDE, é possível escolher nossos planos Code. Os preços abaixo são mensais com cobrança anual:
| Plano | Preço | Indicado para |
|---|---|---|
| Moderato | US$ 15 / mês | Usuários que precisam de cotas de uso renovadas semanalmente e acesso em vários dispositivos para fluxos regulares de programação |
| Allegretto | US$ 31 / mês | Usuários avançados que precisam de limites semanais maiores e limites de concorrência mais altos |
| Allegro | US$ 79 / mês | Usuários que trabalham em tarefas de desenvolvimento intensivas, projetos complexos e cargas de trabalho maiores |
| Vivace | US$ 159 / mês | Usuários que precisam das maiores cotas semanais do plano para projetos complexos e grandes bases de código |
Cada plano inclui limites de uso renovados semanalmente. Planos de nível superior oferecem limites semanais maiores e limites de concorrência mais altos, sendo adequados para projetos mais complexos. Para ver os detalhes mais recentes dos planos, consulte a página oficial de assinatura.
Preços da Kimi API
O Kimi K2.7 Code está disponível pela Kimi API com cobrança por uso, baseada em token:
| Modelo | Unidade | Preço de entrada (cache encontrado) | Preço de entrada (cache não encontrado) | Preço de saída | Janela de contexto |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M tokens | $0.19 | $0.95 | $4.00 | 262,144 tokens |
A API oferece suporte a cache automático de contexto, o que reduz o custo de entrada para contextos reutilizados (cache encontrado $0.19 vs cache não encontrado $0.95 por milhão de tokens). Os preços não incluem impostos aplicáveis. Consulte a documentação oficial de preços para ver os valores mais recentes.