Preços do Kimi K2.6 para API e assinatura

Tempo de leitura: 8 minutos2026-07-28

O Kimi K2.6 é um modelo open-source com recursos avançados de programação, execução de longo horizonte e agent swarm. Veja abaixo uma visão geral dos preços da Kimi API e dos planos de assinatura do Kimi.

Visão geral dos preços da API do Kimi K2.6

Os preços da API do Kimi K2.6 seguem um modelo baseado em token, com uso cobrado por 1 milhão de tokens (1.000.000 tokens) tanto para o processamento de entrada quanto de saída, permitindo controle de custos claro e previsível.

Modelo	Unidade	Preço de entrada (cache hit)	Preço de entrada (cache miss)	Preço de saída	Janela de contexto
kimi-k2.6	1M tokens	$0.16	$0.95	$4.00	262,144 tokens

Modelo de preços da API do Kimi K2.6

A API do Kimi K2.6 usa um modelo de preços baseado em token para cada solicitação, no qual toda interação com o modelo consome tokens cobrados conforme o tipo. Nesse modelo, os tokens geralmente se dividem em três categorias: tokens de entrada, tokens de saída e tokens de entrada em cache.

Tokens de entrada

Tokens de entrada representam tudo o que é enviado ao modelo, incluindo:

Prompts do usuário
Instruções do sistema
Histórico ou contexto da conversa

Esses tokens determinam quanto contexto o modelo precisa processar antes de gerar uma resposta.

Tokens de saída

Tokens de saída são gerados pelo modelo em resposta a uma solicitação. Eles representam o conteúdo de fato gerado por AI, como:

Respostas em texto
Geração de código
Saídas estruturadas

Como a geração de saída exige computação adicional, seu preço normalmente é mais alto que o dos tokens de entrada.

Tokens de entrada em cache

Tokens de entrada em cache ocorrem quando um contexto processado anteriormente é reutilizado.

Se o mesmo contexto, ou um contexto semelhante, for reutilizado, ele pode ser atendido a um custo reduzido
Isso aumenta significativamente a eficiência em fluxos de trabalho repetitivos
É especialmente útil em aplicações de contexto longo ou interações com várias rodadas

Configurar chave de API

Observações sobre os preços da API do Kimi K2.6

Os preços da API do Kimi K2.6 seguem um modelo transparente baseado em consumo, com alguns detalhes importantes abaixo para ajudar desenvolvedores a entender melhor a cobrança e o comportamento dos custos.

Política de impostos e cobrança

Todos os preços listados para a API do Kimi K2.6 não incluem impostos aplicáveis. Os impostos são calculados automaticamente no checkout com base na região de cobrança do usuário e nas exigências fiscais locais, garantindo faturamento preciso e em conformidade para cada pedido.

Explicação sobre uso de token

Para tornar os preços da API do Kimi K2.6 mais fáceis de entender, a cobrança é calculada usando um padrão consistente de token:

1M tokens = 1,000,000 tokens
Tokens de entrada incluem prompts e informações contextuais
Tokens de saída representam respostas geradas pelo modelo

Essa estrutura garante uma estimativa de custos transparente e previsível em todas as solicitações da Kimi API.

Eficiência de custos baseada em cache

O Kimi K2.6 também inclui um mecanismo de cache que ajuda a otimizar os custos de uso. Ao trabalhar com entradas repetidas ou semelhantes, tokens de entrada em cache são cobrados a uma tarifa reduzida, o que ajuda a diminuir o consumo total no modelo de preços da Kimi API.

Tokens de entrada em cache são cobrados com desconto
Contexto reutilizado reduz o consumo total de tokens
Aumenta a eficiência em sessões longas e fluxos de trabalho repetitivos

Isso torna os preços da API do Kimi K2.6 mais econômicos em cenários de produção nos quais prompts ou contextos são reutilizados com frequência.

Embora não haja um plano gratuito permanente da Kimi API para uso em produção, o modelo de preços foi criado para continuar flexível e escalável, permitindo que desenvolvedores controlem custos com base no consumo real de token.

Configurar chave de API

Planos de preços e faixas de uso do Kimi K2.6

Além dos preços de uso baseados em API, o Kimi oferece planos de assinatura em níveis que acompanham suas necessidades, facilitando a escolha do nível certo para seu fluxo de trabalho. Esses planos permitem que os usuários escolham a opção mais adequada conforme suas necessidades de uso diário e escala. Para ver os detalhes mais recentes dos planos, confira a página oficial de assinatura.

Recurso	Adagio	Moderato	Allegretto	Allegro	Vivace
Cobrança anual (valor mensal efetivo)	$0 / mês	$15 / mês	$31 / mês	$79 / mês	$159 / mês
Tarefas simultâneas	1 tarefa	2 tarefas	2 tarefas	4 tarefas	4 tarefas
Fila prioritária do Agent	×	Velocidade 4×	Velocidade 4×	Velocidade 4×	Velocidade 4×
Agent Swarm	×	✓	✓	✓	✓
Subagentes simultâneos	×	2 subagentes	4 subagentes	8 subagentes	8 subagentes
Kimi Claw	×	×	✓	✓	✓
Kimi Claw (Web, Android, PC)	×	×	✓	✓	✓
Chat em grupo com Claw	×	×	10 chats	10 chats	10 chats
Implantar site com banco de dados	×	✓	✓	✓	✓

Escolha seu plano

Conclusão

O Kimi K2.6 oferece preços flexíveis tanto para desenvolvedores quanto para usuários em geral. A precificação da API baseada em token mantém os custos transparentes e previsíveis, com suporte a cache para reduzir despesas em fluxos de trabalho de alto volume ou de contexto longo. Para quem prefere acesso estruturado, os planos de assinatura em níveis vão do uso gratuito ao profissional, abrangendo recursos de Agent, tarefas simultâneas e ferramentas como Kimi Claw e Agent Swarm. Seja para integrar via API ou explorar todo o conjunto de recursos do Kimi, há um plano pensado para se ajustar ao seu fluxo de trabalho e orçamento.

Perguntas frequentes

Como são calculados os preços da API do Kimi K2.6?

Os preços da API do Kimi K2.6 são calculados com base no uso de token, incluindo tokens de entrada, tokens de saída e tokens de entrada em cache. Todo o uso é cobrado por 1 milhão de tokens (1.000.000 tokens), o que torna os custos da Kimi API fáceis de medir e prever em diferentes cargas de trabalho.

O que mais afeta o custo total da API?

Os principais fatores de custo são o uso de tokens de saída, o tamanho do prompt e o tamanho do contexto. Na maioria dos casos, respostas mais longas e entradas maiores aumentam o uso total no modelo de preços da API K2.6.

A API do Kimi K2.6 fica mais barata com tokens em cache?

Sim. Tokens de entrada em cache são cobrados a uma tarifa reduzida porque contextos processados anteriormente podem ser reutilizados. Isso torna os preços da Kimi API mais eficientes para solicitações repetidas ou semelhantes.

Quantos tokens o Kimi K2.6 aceita por solicitação?

O modelo oferece uma janela de contexto máxima de 256K tokens, permitindo lidar com documentos longos, conversas extensas e tarefas complexas de várias etapas em uma única solicitação.

O que acontece se minha entrada exceder a janela de contexto?

O Kimi K2.6 aceita até 256K tokens por solicitação. Se a entrada ultrapassar esse limite, ela precisa ser dividida ou encurtada antes do processamento pela Kimi API.

O Kimi K2.6 oferece suporte a uso em alto volume ou em escala empresarial?

Sim. O Kimi K2.6 foi projetado para cargas de trabalho escaláveis, com suporte tanto a aplicações leves quanto a cenários empresariais de alto throughput, com preços previsíveis baseados em token.

A API do Kimi K2.6 tem taxas ocultas?

Não. O modelo de preços da Kimi API é totalmente transparente e se baseia apenas no uso de token. Não há taxas ocultas de plataforma, embora impostos possam ser aplicados conforme a região do usuário.