Preços do Kimi K2.7 Code explicados: custos e planos da API

Q: Como é calculada a cobrança da API Kimi K2.7 Code?

A API Kimi K2\.7 Code usa cobrança por token\. Cada solicitação consome tokens de entrada $seu prompt mais o contexto$ e tokens de saída $a resposta gerada pelo modelo$\. Os tokens de entrada são cobrados a \$0\.95 por 1 milhão de tokens em caso de cache miss, ou \$0\.19 por 1 milhão de tokens em caso de cache hit\. Os tokens de saída são cobrados a \$4\.00 por 1 milhão de tokens para o modelo padrão e a \$8\.00 por 1 milhão de tokens para a variante de alta velocidade\. Todos os preços não incluem impostos aplicáveis\.

Q: Os preços da API Kimi K2.7 Code funcionam para uso em escala empresarial?

Sim\. O modelo baseado em tokens escala de desenvolvedores individuais a implantações empresariais, sem limite máximo de uso\. Em cenários de alto volume, o mecanismo automático de cache de contexto reduz significativamente os custos quando entradas semelhantes são reutilizadas entre sessões\. Se você precisa de condições empresariais personalizadas, suporte dedicado ou descontos por volume, entre em contato com a equipe de vendas da Kimi pela Kimi API Platform\.

Assine agora

Tempo de leitura: 8 minutos2026-06-25

Planos de assinatura e faixas de uso do Kimi K2.7 Code

Se você quer usar o Kimi K2.7 Code diretamente no terminal ou na IDE, o caminho mais simples é uma assinatura Kimi Code.

	Moderato	Allegretto	Allegro	Vivace
Preço mensal	$19 / mês	$39 / mês	$99 / mês	$199 / mês
Descrição	Cotas de uso renovadas semanalmente com login em vários dispositivos, permitindo compartilhar seu plano entre dispositivos e trabalhar com eficiência em vários projetos	Limites semanais amplos e maior capacidade de concorrência, oferecendo uma solução de alto valor para usuários avançados	Cota ampla, projetada para alto desempenho. Lida sem esforço com tudo, das tarefas diárias ao desenvolvimento intensivo	Oferece nossas maiores cotas semanais de plano, permitindo lidar com projetos complexos e grandes bases de código com facilidade

Cada plano inclui cotas de uso renovadas semanalmente. Categorias superiores oferecem limites semanais maiores e maior capacidade de concorrência, sendo adequadas para projetos mais exigentes. Para ver os detalhes mais recentes dos planos, consulte a página oficial de assinatura.

Assine agora

O que está incluído além do Kimi Code?

Ao comprar qualquer plano Kimi Code, você também desbloqueia os benefícios mais amplos da assinatura Kimi, impulsionados principalmente pelo Kimi K2.6.

	Adagio	Moderato	Allegretto	Allegro	Vivace
Preço	$0	$19 / mês	$39 / mês	$99 / mês	$199 / mês
Uso do Agent	6	60	150	360	720
Tarefas simultâneas do Agent	1 tarefa	2 tarefas	2 tarefas	4 tarefas	4 tarefas
Fila prioritária do Agent	✗	velocidade 4x	velocidade 4x	velocidade 4x	velocidade 4x
Agent Swarm	✗	25 usos incluídos	50 usos incluídos	120 usos incluídos	240 usos incluídos
Subagents simultâneos do Agent Swarm	✗	2 subagents	4 subagents	4 subagents	8 subagents
Kimi Claw	✗	✗	✓	✓	✓
Kimi Claw Android	✗	✗	✓	✓	✓
Kimi Claw PC	✗	✗	✓	✓	✓
Chat em grupo com Claw	✗	✗	10 chats em grupo	10 chats em grupo	10 chats em grupo
Implantar um site com banco de dados	✗	✓	✓	✓	✓
Tarefas agendadas ativas do Kimi Work	2 tarefas	10 tarefas	15 tarefas	20 tarefas	20 tarefas

Esses benefícios entre produtos estão disponíveis em todos os planos pagos junto com o uso do Kimi K2.7 Code, reunindo em uma única assinatura um agent dedicado à programação e um workspace completo de IA.

Assine agora

Preços da API Kimi K2.7 Code

Os preços da API Kimi K2.7 Code usam um modelo baseado em token, com cobrança por 1M de tokens (1.000.000 tokens) tanto para processamento de entrada quanto de saída, permitindo um controle de custos claro e previsível.

Modelo	Unidade	Preço de entrada (cache hit)	Preço de entrada (cache miss)	Preço de saída	Janela de contexto
kimi-k2.7-code	1M de tokens	$0.19	$0.95	$4.00	262.144 tokens
kimi-k2.7-code-highspeed	1M de tokens	$0.38	$1.90	$8.00	262.144 tokens

O modelo padrão kimi-k2.7-code entrega o desempenho de programação mais inteligente da Kimi, com suporte completo a raciocínio em contexto longo e tarefas agenticas. A variante kimi-k2.7-code-highspeed oferece velocidade de saída de aproximadamente 180 Tokens/s (até 260 Tokens/s em cenários de contexto curto), proporcionando uma experiência extrema de programação para fluxos de trabalho sensíveis à latência.

Obter créditos de API

Como funciona a cobrança da API Kimi K2.7 Code

A API Kimi K2.7 Code usa um modelo de preços baseado em token para cada solicitação, em que cada interação com o modelo consome tokens cobrados de acordo com seu tipo. Nesse modelo, os tokens geralmente são classificados em três tipos: tokens de entrada, tokens de saída e tokens de entrada em cache.

Tokens de entrada

Tokens de entrada representam tudo o que é enviado ao modelo, incluindo:

Prompts do usuário
Instruções do sistema
Histórico da conversa ou contexto

Esses tokens determinam quanto contexto o modelo precisa processar antes de gerar uma resposta.

Tokens de entrada em cache

Tokens de entrada em cache ocorrem quando um contexto processado anteriormente é reutilizado.

Se o mesmo contexto, ou um contexto semelhante, for reutilizado, ele poderá ser servido a um custo reduzido
Isso melhora significativamente a eficiência em fluxos de trabalho repetitivos
É especialmente útil em aplicações de contexto longo ou interações em múltiplos turnos

Tokens de saída

Tokens de saída são gerados pelo modelo em resposta a uma solicitação. Eles representam o conteúdo efetivamente gerado por IA, como:

Geração de código
Respostas em texto
Saídas estruturadas

Como a geração de saída exige computação adicional, normalmente ela custa mais do que os tokens de entrada.

Obter créditos de API

Conclusão

Kimi K2.7 Code oferece uma estrutura de preços transparente e flexível, capaz de escalar de projetos individuais de desenvolvimento a grandes cargas de trabalho em produção. Com cobrança baseada em token, descontos por cache e uma opção de modelo de alta velocidade, os desenvolvedores podem equilibrar desempenho e custo conforme suas necessidades específicas. Isso facilita criar, testar e implantar fluxos de trabalho de programação com IA mantendo os gastos previsíveis.

Perguntas frequentes

Como é calculada a cobrança da API Kimi K2.7 Code?

A API Kimi K2.7 Code usa cobrança por token. Cada solicitação consome tokens de entrada (seu prompt mais o contexto) e tokens de saída (a resposta gerada pelo modelo). Os tokens de entrada são cobrados a $0.95 por 1 milhão de tokens em caso de cache miss, ou $0.19 por 1 milhão de tokens em caso de cache hit. Os tokens de saída são cobrados a $4.00 por 1 milhão de tokens para o modelo padrão e a $8.00 por 1 milhão de tokens para a variante de alta velocidade. Todos os preços não incluem impostos aplicáveis.

Quanto posso economizar com o cache de contexto?

Quando um contexto processado anteriormente é reutilizado, os tokens de entrada em cache são cobrados a $0.19 por 1 milhão de tokens, em vez de $0.95 — uma redução de 80% nos custos de entrada para contexto repetido. Isso torna o cache especialmente eficaz em longas sessões de programação com múltiplas interações, fluxos de depuração iterativa e qualquer cenário em que prompts semelhantes ou o contexto da base de código sejam enviados repetidamente.

Devo usar a API ou um plano de assinatura Kimi?

Use a API se você estiver criando uma ferramenta personalizada, um pipeline de CI/CD ou uma plataforma interna para desenvolvedores em que precise de acesso programático e controle granular sobre o consumo de tokens. Use um plano de assinatura Kimi (a partir de $19/mês) se quiser acesso imediato pelo Kimi Code no terminal e na IDE, sem gerenciar chaves de API nem estimar o uso de tokens. Os planos de assinatura incluem créditos Kimi Code renovados semanalmente; categorias superiores liberam mais créditos e maior concorrência.

Os preços da API Kimi K2.7 Code funcionam para uso em escala empresarial?

Sim. O modelo baseado em tokens escala de desenvolvedores individuais a implantações empresariais, sem limite máximo de uso. Em cenários de alto volume, o mecanismo automático de cache de contexto reduz significativamente os custos quando entradas semelhantes são reutilizadas entre sessões. Se você precisa de condições empresariais personalizadas, suporte dedicado ou descontos por volume, entre em contato com a equipe de vendas da Kimi pela Kimi API Platform.