Preços do Kimi K2.6 para API e assinatura

Tempo de leitura: 8 minutos2026-06-17

O Kimi K2.6 é um modelo de código aberto com recursos de ponta para programação, execução de longo horizonte e agent swarm. A seguir, apresentamos uma visão geral dos preços da Kimi API e dos planos de assinatura Kimi.

Visão geral dos preços da API do Kimi K2.6

Os preços da API do Kimi K2.6 usam um modelo baseado em tokens, com uso cobrado por 1 milhão de tokens (1.000.000 tokens) tanto para processamento de entrada quanto de saída, permitindo controle de custos claro e previsível.

ModeloUnidadePreço de entrada (cache hit)Preço de entrada (cache miss)Preço de saídaJanela de contexto
kimi-k2.61M tokens$0.16$0.95$4.00262,144 tokens

Modelo de preços da API do Kimi K2.6

A API do Kimi K2.6 usa um modelo de preços baseado em tokens para cada solicitação, no qual cada interação com o modelo consome tokens cobrados conforme seu tipo. Nesse modelo, os tokens geralmente são classificados em três tipos: tokens de entrada, tokens de saída e tokens de entrada em cache.

Tokens de entrada

Tokens de entrada representam tudo o que é enviado ao modelo, incluindo:

  • Prompts do usuário

  • Instruções do sistema

  • Histórico ou contexto da conversa

Esses tokens determinam quanto contexto o modelo precisa processar antes de gerar uma resposta.

Tokens de saída

Tokens de saída são gerados pelo modelo em resposta a uma solicitação. Eles representam o conteúdo efetivamente gerado por IA, como:

  • Respostas em texto

  • Geração de código

  • Saídas estruturadas

Como a geração de saída exige processamento adicional, normalmente seu preço é maior que o dos tokens de entrada.

Tokens de entrada em cache

Tokens de entrada em cache ocorrem quando um contexto processado anteriormente é reutilizado.

  • Se o mesmo contexto, ou um contexto semelhante, for reutilizado, ele poderá ser servido a um custo reduzido

  • Isso aumenta significativamente a eficiência em fluxos de trabalho repetitivos

  • É especialmente útil em aplicações com contexto longo ou interações de várias rodadas

Observações sobre preços da API do Kimi K2.6

Os preços da API do Kimi K2.6 seguem um modelo transparente baseado em consumo, com alguns detalhes importantes descritos abaixo para ajudar desenvolvedores a entender melhor a cobrança e o comportamento dos custos.

Política de impostos e cobrança

Todos os preços listados para a API do Kimi K2.6 não incluem impostos aplicáveis. Os impostos são calculados automaticamente no checkout com base na região de cobrança do usuário e nas exigências fiscais locais, garantindo faturamento preciso e em conformidade para cada pedido.

Explicação sobre o uso de tokens

Para facilitar a compreensão dos preços da API do Kimi K2.6, a cobrança é calculada usando um padrão consistente de tokens:

  • 1M tokens = 1,000,000 tokens

  • Tokens de entrada incluem prompts e informações contextuais

  • Tokens de saída representam respostas geradas pelo modelo

Essa estrutura garante uma estimativa de custos transparente e previsível em todas as solicitações da Kimi API.

Eficiência de custos baseada em cache

O Kimi K2.6 também inclui um mecanismo de cache que ajuda a otimizar os custos de uso. Ao trabalhar com entradas repetidas ou semelhantes, tokens de entrada em cache são cobrados a uma tarifa reduzida, o que ajuda a diminuir o consumo total no modelo de preços da Kimi API.

  • Tokens de entrada em cache são cobrados com desconto

  • O contexto reutilizado reduz o consumo total de tokens

  • Aumenta a eficiência em sessões longas e fluxos de trabalho repetitivos

Isso torna os preços da API do Kimi K2.6 mais econômicos para cenários de produção em que prompts ou contextos são reutilizados com frequência.

Embora não haja um plano gratuito permanente da Kimi API para uso em produção, o modelo de preços foi projetado para se manter flexível e escalável, permitindo que desenvolvedores controlem custos com base no consumo real de tokens.

Planos de preços e faixas de uso do Kimi K2.6

Além dos preços de uso baseados em API, a Kimi oferece planos de assinatura em níveis que acompanham suas necessidades, facilitando a escolha do nível ideal para seu fluxo de trabalho. Esses planos permitem que os usuários escolham o nível mais adequado conforme suas necessidades de uso diário e requisitos de escala.

RecursoAdagioModeratoAllegrettoAllegroVivace
Cobrança anual (mensal efetivo)US$ 0 / mêsUS$ 15 / mêsUS$ 31 / mêsUS$ 79 / mêsUS$ 159 / mês
Uso de Agent660150360720
Tarefas simultâneas1 tarefa2 tarefas2 tarefas4 tarefas4 tarefas
Fila prioritária do Agent×velocidade 4×velocidade 4×velocidade 4×velocidade 4×
Agent Swarm××50 usos incluídos120 usos incluídos240 usos incluídos
Subagents simultâneos××4 subagents4 subagents8 subagents
Kimi Code×1× créditos5× créditos15× créditos30× créditos
Kimi Claw××
Kimi Claw Android××
Kimi Claw (Mac ARM / PC)××
Chat em grupo com Claw××10 chats10 chats10 chats
Solicitações profissionais de dados200200050001200024000
Implantar site com banco de dados×

Conclusão

O Kimi K2.6 oferece preços flexíveis tanto para desenvolvedores quanto para usuários do dia a dia. A precificação da API baseada em tokens mantém os custos transparentes e previsíveis, com suporte a cache para reduzir despesas em fluxos de trabalho de alto volume ou com contextos longos. Para quem prefere acesso estruturado, os planos de assinatura em níveis vão do uso gratuito ao profissional, cobrindo recursos de agent, tarefas simultâneas e ferramentas como Kimi Claw e Agent Swarm. Seja integrando via API ou explorando todos os recursos da Kimi, há um plano pensado para se ajustar ao seu fluxo de trabalho e ao seu orçamento.

Perguntas frequentes

Como são calculados os preços da API do Kimi K2.6?
Os preços da API do Kimi K2.6 são calculados com base no uso de tokens, incluindo tokens de entrada, tokens de saída e tokens de entrada em cache. Todo o uso é cobrado por 1 milhão de tokens (1.000.000 tokens), tornando os custos da Kimi API fáceis de medir e prever em diferentes cargas de trabalho.
O que mais afeta o custo total da API?
Os principais fatores de custo são o uso de tokens de saída, o tamanho do prompt e o tamanho do contexto. Na maioria dos casos, respostas mais longas e entradas maiores aumentam o uso total no modelo de preços da API K2.6.
A API do Kimi K2.6 fica mais barata com tokens em cache?
Sim. Tokens de entrada em cache são cobrados a uma tarifa reduzida porque o contexto processado anteriormente pode ser reutilizado. Isso torna os preços da Kimi API mais eficientes para solicitações repetidas ou semelhantes.
Quantos tokens o Kimi K2.6 aceita por solicitação?
O modelo oferece uma janela de contexto máxima de 256K tokens, permitindo lidar com documentos longos, conversas extensas e tarefas complexas de várias etapas em uma única solicitação.
O que acontece se minha entrada exceder a janela de contexto?
O Kimi K2.6 aceita até 256K tokens por solicitação. Se a entrada exceder esse limite, ela precisará ser dividida ou encurtada antes do processamento pela Kimi API.
O Kimi K2.6 é compatível com uso em alto volume ou em escala corporativa?
Sim. O Kimi K2.6 foi projetado para cargas de trabalho escaláveis, com suporte tanto a aplicações leves quanto a cenários corporativos de alta vazão, com preços previsíveis baseados em tokens.
A API do Kimi K2.6 tem taxas ocultas?
Não. O modelo de preços da Kimi API é totalmente transparente e baseado apenas no uso de tokens. Não há taxas ocultas de plataforma, embora impostos possam ser aplicados conforme a região do usuário.