Kimi K2.7 Code

Um modelo agentic de código aberto, voltado para programação e criado para engenharia de software de longo horizonte

Tempo de leitura: 8 minutos2026-07-22

O que é o Kimi K2.7 Code?

Kimi K2.7 Code é um modelo agentic de código aberto, voltado para programação, desenvolvido pela Moonshot AI. Ele oferece desempenho superior em programação e em agent, com avanços substanciais em tarefas reais de programação de longo horizonte. Esses ganhos se traduzem em taxas mais altas de conclusão ponta a ponta em fluxos complexos de engenharia de software. O K2.7 Code também melhora a eficiência do raciocínio, reduzindo o uso de thinking tokens em aproximadamente 30% em comparação com o K2.6.

Desempenho em benchmarks

O Kimi K2.7 Code foi avaliado em comparação com o K2.6 usando uma combinação de benchmarks internos e externos que cobrem duas dimensões: capacidade de programação e execução de tarefas agentic.

Comparação de benchmarks entre Kimi K2.7 Code, Kimi K2.6, GPT-5.5 e Claude Opus 4.8 em seis benchmarks de programação e agentic

Nos benchmarks de programação, o K2.7 Code apresenta ganhos substanciais sobre o K2.6: +21,8% no Kimi Code Bench v2 (62,0 vs 50,9), +11,0% no Program Bench (53,6 vs 48,3) e +31,5% no MLS Bench Lite (35,1 vs 26,7).

Uma capacidade de programação mais forte também se traduz em melhor desempenho agentic. No Kimi Claw 24/7 Bench, no MCP Atlas e no MCP Mark Verified — benchmarks que medem a execução autônoma de tarefas por agent —, o K2.7 Code melhora cerca de 10% em relação ao K2.6.

Programação:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentic:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

O Kimi Code Bench v2 é um benchmark interno desenvolvido pela Moonshot AI, e o Kimi Claw 24/7 Bench é um benchmark interno para avaliação agentic. O Kimi K2.7 Code e o K2.6 foram testados via Kimi Code CLI com pensamento ativado (temperatura 1.0, top-p 0.95, contexto de 262.144 tokens), enquanto o GPT-5.5 foi avaliado no Codex (xhigh) e o Opus 4.8 no Claude Code (xhigh). As exceções por benchmark e a metodologia completa estão detalhadas no cartão do modelo no Hugging Face.

Criado para programação de longo horizonte

A engenharia de software no mundo real raramente se resolve em uma única etapa. Tarefas como refatorar uma base de código, implementar um recurso em vários arquivos ou depurar durante longas sessões com agent exigem que o modelo siga instruções de forma confiável em contextos extensos e leve a tarefa até a conclusão.

O Kimi K2.7 Code é otimizado para esses cenários de longo horizonte. Em comparação com o K2.6, ele segue instruções com mais confiabilidade em contextos longos e alcança taxas mais altas de sucesso ponta a ponta, sendo mais adequado para fluxos complexos de engenharia de software.

Experimente no Kimi Code

Eficiência de raciocínio otimizada

Modelos de raciocínio tendem a pensar demais, gastando milhares de tokens deliberando sobre problemas que não exigem isso. O Kimi K2.7 Code reduz significativamente essa tendência: em média, corta em aproximadamente 30% o uso de thinking tokens em comparação com o K2.6.

No Kimi Code Bench v2, no Program Bench e no MLS Bench Lite, o Kimi K2.7 Code alcança pontuações maiores que o K2.6 consumindo menos tokens em cada benchmark.

Para desenvolvedores, essa eficiência se multiplica a cada tarefa: respostas mais rápidas em sessões interativas de programação, custos menores de API em produção e fluxos de trabalho com agent que concluem mais trabalho dentro do mesmo orçamento de contexto.

Experimente no Kimi Code

Arquitetura do modelo

O Kimi K2.7 Code é construído sobre uma arquitetura Mixture-of-Experts (MoE), com 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados por token. O modelo oferece suporte a um comprimento de contexto de 256K e usa Multi-head Latent Attention (MLA). Também inclui o MoonViT, um codificador de visão com 400M parâmetros.

Parâmetro	Valor
Arquitetura	Mixture-of-Experts (MoE)
Parâmetros totais	1T
Parâmetros ativados	32B
Número de camadas (incluindo camada densa)	61
Número de camadas densas	1
Dimensão oculta de atenção	7168
Dimensão oculta do MoE (por Expert)	2048
Número de cabeças de atenção	64
Número de Experts	384
Experts selecionados por token	8
Número de Experts compartilhados	1
Tamanho do vocabulário	160K
Comprimento do contexto	256K
Mecanismo de atenção	MLA
Função de ativação	SwiGLU
Codificador de visão	MoonViT
Parâmetros do codificador de visão	400M

Os pesos completos do modelo são de código aberto e estão disponíveis no Hugging Face.

Como escolher entre Kimi K2.7 Code e K2.6

O Kimi K2.7 Code foi criado especificamente para tarefas de programação. Para trabalhos de uso geral, como escrita, análise e conversa, recomendamos o K2.6, que oferece recursos mais equilibrados.

Como acessar o Kimi K2.7 Code

Onde usar

O Kimi K2.7 Code está disponível por meio de:

Kimi Code (https://www.kimi.com/code). O Kimi K2.7 Code agora é o modelo padrão, com o modo de pensamento ativado por padrão. Para começar, siga as instruções de configuração na página.
Kimi API na plataforma aberta (https://platform.kimi.ai/). Desenvolvedores podem chamar o Kimi K2.7 Code via Kimi API e integrá-lo a seus próprios fluxos de programação, agents e ferramentas de desenvolvimento.

Obrigatoriedade do modo de pensamento

O Kimi K2.7 Code não oferece suporte ao modo sem pensamento. Ele sempre é executado com o pensamento ativado, tanto na Kimi API quanto no Kimi Code. No Kimi Code, solicitações feitas com o pensamento desativado são atendidas automaticamente pelo K2.6.

Preços do Kimi K2.7 Code

Planos Kimi Code

Para usuários que desejam experimentar o Kimi K2.7 Code diretamente pelo Kimi Code, incluindo plugins de terminal e IDE, é possível escolher nossos planos Code. Os preços abaixo são mensais com cobrança anual:

Plano	Preço	Indicado para
Moderato	US$ 15 / mês	Usuários que precisam de cotas de uso renovadas semanalmente e acesso em vários dispositivos para fluxos regulares de programação
Allegretto	US$ 31 / mês	Usuários avançados que precisam de limites semanais maiores e limites de concorrência mais altos
Allegro	US$ 79 / mês	Usuários que trabalham em tarefas de desenvolvimento intensivas, projetos complexos e cargas de trabalho maiores
Vivace	US$ 159 / mês	Usuários que precisam das maiores cotas semanais do plano para projetos complexos e grandes bases de código

Cada plano inclui limites de uso renovados semanalmente. Planos de nível superior oferecem limites semanais maiores e limites de concorrência mais altos, sendo adequados para projetos mais complexos. Para ver os detalhes mais recentes dos planos, consulte a página oficial de assinatura.

Preços da Kimi API

O Kimi K2.7 Code está disponível pela Kimi API com cobrança por uso, baseada em token:

Modelo	Unidade	Preço de entrada (cache encontrado)	Preço de entrada (cache não encontrado)	Preço de saída	Janela de contexto
kimi-k2.7-code	1M tokens	$0.19	$0.95	$4.00	262,144 tokens

A API oferece suporte a cache automático de contexto, o que reduz o custo de entrada para contextos reutilizados (cache encontrado $0.19 vs cache não encontrado $0.95 por milhão de tokens). Os preços não incluem impostos aplicáveis. Consulte a documentação oficial de preços para ver os valores mais recentes.

Perguntas frequentes

O Kimi K2.7 Code é de código aberto?

Sim. Os pesos do modelo são de código aberto e estão disponíveis para download no Hugging Face, onde você também encontra guias de implantação e a documentação completa.

Qual é a janela de contexto do Kimi K2.7 Code?

O Kimi K2.7 Code oferece uma janela de contexto de 256K (262.144 tokens), sendo ideal para bases de código em escala de repositório e sessões longas de programação com várias interações.

O Kimi K2.7 Code aceita entradas de imagem e vídeo?

Sim. O Kimi K2.7 Code usa uma arquitetura multimodal nativa que aceita entradas de texto, imagem e vídeo, além de seus recursos de programação e agentic.

É obrigatório usar o modo de pensamento no Kimi K2.7 Code?

Sim. O Kimi K2.7 Code não oferece suporte ao modo sem pensamento e sempre é executado com o pensamento ativado. No Kimi Code, solicitações feitas com o pensamento desativado são atendidas automaticamente pelo K2.6.