Kimi K2.7 Code

Um modelo agentic de código aberto, voltado para programação e criado para engenharia de software de longo horizonte

Tempo de leitura: 8 minutos2026-06-18
Kimi K2.7 Code

O que é o Kimi K2.7 Code?

Kimi K2.7 Code é um modelo agentic de código aberto, voltado para programação, desenvolvido pela Moonshot AI. Ele oferece desempenho superior em programação e em agent, com avanços substanciais em tarefas reais de programação de longo horizonte. Esses ganhos se traduzem em taxas mais altas de conclusão ponta a ponta em fluxos complexos de engenharia de software. O K2.7 Code também melhora a eficiência do raciocínio, reduzindo o uso de thinking tokens em aproximadamente 30% em comparação com o K2.6.

Desempenho em benchmarks

O Kimi K2.7 Code foi avaliado em comparação com o K2.6 usando uma combinação de benchmarks internos e externos que cobrem duas dimensões: capacidade de programação e execução de tarefas agentic.

Comparação de benchmarks entre Kimi K2.7 Code, Kimi K2.6, GPT-5.5 e Claude Opus 4.8 em seis benchmarks de programação e agentic

Nos benchmarks de programação, o K2.7 Code apresenta ganhos substanciais sobre o K2.6: +21,8% no Kimi Code Bench v2 (62,0 vs 50,9), +11,0% no Program Bench (53,6 vs 48,3) e +31,5% no MLS Bench Lite (35,1 vs 26,7).

Uma capacidade de programação mais forte também se traduz em melhor desempenho agentic. No Kimi Claw 24/7 Bench, no MCP Atlas e no MCP Mark Verified — benchmarks que medem a execução autônoma de tarefas por agent —, o K2.7 Code melhora cerca de 10% em relação ao K2.6.

  • Programação:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
Program Bench48.353.669.163.8
MLS Bench Lite26.735.135.542.8
  • Agentic:

BenchmarkKimi K2.6Kimi K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Claw 24/7 Bench42.946.952.850.4
MCP Atlas69.476.079.481.3
MCP Mark Verified72.881.192.976.4

O Kimi Code Bench v2 é um benchmark interno desenvolvido pela Moonshot AI, e o Kimi Claw 24/7 Bench é um benchmark interno para avaliação agentic. O Kimi K2.7 Code e o K2.6 foram testados via Kimi Code CLI com pensamento ativado (temperatura 1.0, top-p 0.95, contexto de 262.144 tokens), enquanto o GPT-5.5 foi avaliado no Codex (xhigh) e o Opus 4.8 no Claude Code (xhigh). As exceções por benchmark e a metodologia completa estão detalhadas no cartão do modelo no Hugging Face.

Criado para programação de longo horizonte

A engenharia de software no mundo real raramente se resolve em uma única etapa. Tarefas como refatorar uma base de código, implementar um recurso em vários arquivos ou depurar durante longas sessões com agent exigem que o modelo siga instruções de forma confiável em contextos extensos e leve a tarefa até a conclusão.

O Kimi K2.7 Code é otimizado para esses cenários de longo horizonte. Em comparação com o K2.6, ele segue instruções com mais confiabilidade em contextos longos e alcança taxas mais altas de sucesso ponta a ponta, sendo mais adequado para fluxos complexos de engenharia de software.

Eficiência de raciocínio otimizada

Modelos de raciocínio tendem a pensar demais, gastando milhares de tokens deliberando sobre problemas que não exigem isso. O Kimi K2.7 Code reduz significativamente essa tendência: em média, corta em aproximadamente 30% o uso de thinking tokens em comparação com o K2.6.

No Kimi Code Bench v2, no Program Bench e no MLS Bench Lite, o Kimi K2.7 Code alcança pontuações maiores que o K2.6 consumindo menos tokens em cada benchmark.

Desempenho vs Tokens do Kimi K2.7 Code

Para desenvolvedores, essa eficiência se multiplica a cada tarefa: respostas mais rápidas em sessões interativas de programação, custos menores de API em produção e fluxos de trabalho com agent que concluem mais trabalho dentro do mesmo orçamento de contexto.

Arquitetura do modelo

O Kimi K2.7 Code é construído sobre uma arquitetura Mixture-of-Experts (MoE), com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados por token. O modelo oferece suporte a um comprimento de contexto de 256K e usa Multi-head Latent Attention (MLA). Também inclui o MoonViT, um codificador de visão com 400M parâmetros.

ParâmetroValor
ArquiteturaMixture-of-Experts (MoE)
Parâmetros totais1T
Parâmetros ativados32B
Número de camadas (incluindo camada densa)61
Número de camadas densas1
Dimensão oculta de atenção7168
Dimensão oculta do MoE (por Expert)2048
Número de cabeças de atenção64
Número de Experts384
Experts selecionados por token8
Número de Experts compartilhados1
Tamanho do vocabulário160K
Comprimento do contexto256K
Mecanismo de atençãoMLA
Função de ativaçãoSwiGLU
Codificador de visãoMoonViT
Parâmetros do codificador de visão400M

Os pesos completos do modelo são de código aberto e estão disponíveis no Hugging Face.

Como escolher entre Kimi K2.7 Code e K2.6

O Kimi K2.7 Code foi criado especificamente para tarefas de programação. Para trabalhos de uso geral, como escrita, análise e conversa, recomendamos o K2.6, que oferece recursos mais equilibrados.

Como acessar o Kimi K2.7 Code

Onde usar

O Kimi K2.7 Code está disponível por meio de:

  • Kimi Code (https://www.kimi.com/code). O Kimi K2.7 Code agora é o modelo padrão, com o modo de pensamento ativado por padrão. Para começar, siga as instruções de configuração na página.

    interface do Kimi Code
  • Kimi API na plataforma aberta (https://platform.kimi.ai/). Desenvolvedores podem chamar o Kimi K2.7 Code via Kimi API e integrá-lo a seus próprios fluxos de programação, agents e ferramentas de desenvolvimento.

Obrigatoriedade do modo de pensamento

O Kimi K2.7 Code não oferece suporte ao modo sem pensamento. Ele sempre é executado com o pensamento ativado, tanto na Kimi API quanto no Kimi Code. No Kimi Code, solicitações feitas com o pensamento desativado são atendidas automaticamente pelo K2.6.

Preços do Kimi K2.7 Code

Planos Kimi Code

Para usuários que desejam experimentar o Kimi K2.7 Code diretamente pelo Kimi Code, incluindo plugins de terminal e IDE, é possível escolher nossos planos Code. Os preços abaixo são mensais com cobrança anual:

PlanoPreçoIndicado para
ModeratoUS$ 15 / mêsUsuários que precisam de cotas de uso renovadas semanalmente e acesso em vários dispositivos para fluxos regulares de programação
AllegrettoUS$ 31 / mêsUsuários avançados que precisam de limites semanais maiores e limites de concorrência mais altos
AllegroUS$ 79 / mêsUsuários que trabalham em tarefas de desenvolvimento intensivas, projetos complexos e cargas de trabalho maiores
VivaceUS$ 159 / mêsUsuários que precisam das maiores cotas semanais do plano para projetos complexos e grandes bases de código

Cada plano inclui limites de uso renovados semanalmente. Planos de nível superior oferecem limites semanais maiores e limites de concorrência mais altos, sendo adequados para projetos mais complexos. Para ver os detalhes mais recentes dos planos, consulte a página oficial de assinatura.

Preços da Kimi API

O Kimi K2.7 Code está disponível pela Kimi API com cobrança por uso, baseada em token:

ModeloUnidadePreço de entrada (cache encontrado)Preço de entrada (cache não encontrado)Preço de saídaJanela de contexto
kimi-k2.7-code1M tokens$0.19$0.95$4.00262,144 tokens

A API oferece suporte a cache automático de contexto, o que reduz o custo de entrada para contextos reutilizados (cache encontrado $0.19 vs cache não encontrado $0.95 por milhão de tokens). Os preços não incluem impostos aplicáveis. Consulte a documentação oficial de preços para ver os valores mais recentes.

Perguntas frequentes

O Kimi K2.7 Code é de código aberto?
Sim. Os pesos do modelo são de código aberto e estão disponíveis para download no Hugging Face, onde você também encontra guias de implantação e a documentação completa.
Qual é a janela de contexto do Kimi K2.7 Code?
O Kimi K2.7 Code oferece uma janela de contexto de 256K (262.144 tokens), sendo ideal para bases de código em escala de repositório e sessões longas de programação com várias interações.
O Kimi K2.7 Code aceita entradas de imagem e vídeo?
Sim. O Kimi K2.7 Code usa uma arquitetura multimodal nativa que aceita entradas de texto, imagem e vídeo, além de seus recursos de programação e agentic.
É obrigatório usar o modo de pensamento no Kimi K2.7 Code?
Sim. O Kimi K2.7 Code não oferece suporte ao modo sem pensamento e sempre é executado com o pensamento ativado. No Kimi Code, solicitações feitas com o pensamento desativado são atendidas automaticamente pelo K2.6.