O Kimi K2.6 é um modelo de código aberto com recursos de ponta para programação, execução de longo horizonte e agent swarm. A seguir, apresentamos uma visão geral dos preços da Kimi API e dos planos de assinatura Kimi.
Visão geral dos preços da API do Kimi K2.6
Os preços da API do Kimi K2.6 usam um modelo baseado em tokens, com uso cobrado por 1 milhão de tokens (1.000.000 tokens) tanto para processamento de entrada quanto de saída, permitindo controle de custos claro e previsível.
| Modelo | Unidade | Preço de entrada (cache hit) | Preço de entrada (cache miss) | Preço de saída | Janela de contexto |
|---|---|---|---|---|---|
| kimi-k2.6 | 1M tokens | $0.16 | $0.95 | $4.00 | 262,144 tokens |
Modelo de preços da API do Kimi K2.6
A API do Kimi K2.6 usa um modelo de preços baseado em tokens para cada solicitação, no qual cada interação com o modelo consome tokens cobrados conforme seu tipo. Nesse modelo, os tokens geralmente são classificados em três tipos: tokens de entrada, tokens de saída e tokens de entrada em cache.
Tokens de entrada
Tokens de entrada representam tudo o que é enviado ao modelo, incluindo:
Prompts do usuário
Instruções do sistema
Histórico ou contexto da conversa
Esses tokens determinam quanto contexto o modelo precisa processar antes de gerar uma resposta.
Tokens de saída
Tokens de saída são gerados pelo modelo em resposta a uma solicitação. Eles representam o conteúdo efetivamente gerado por IA, como:
Respostas em texto
Geração de código
Saídas estruturadas
Como a geração de saída exige processamento adicional, normalmente seu preço é maior que o dos tokens de entrada.
Tokens de entrada em cache
Tokens de entrada em cache ocorrem quando um contexto processado anteriormente é reutilizado.
Se o mesmo contexto, ou um contexto semelhante, for reutilizado, ele poderá ser servido a um custo reduzido
Isso aumenta significativamente a eficiência em fluxos de trabalho repetitivos
É especialmente útil em aplicações com contexto longo ou interações de várias rodadas
Observações sobre preços da API do Kimi K2.6
Os preços da API do Kimi K2.6 seguem um modelo transparente baseado em consumo, com alguns detalhes importantes descritos abaixo para ajudar desenvolvedores a entender melhor a cobrança e o comportamento dos custos.
Política de impostos e cobrança
Todos os preços listados para a API do Kimi K2.6 não incluem impostos aplicáveis. Os impostos são calculados automaticamente no checkout com base na região de cobrança do usuário e nas exigências fiscais locais, garantindo faturamento preciso e em conformidade para cada pedido.
Explicação sobre o uso de tokens
Para facilitar a compreensão dos preços da API do Kimi K2.6, a cobrança é calculada usando um padrão consistente de tokens:
1M tokens = 1,000,000 tokens
Tokens de entrada incluem prompts e informações contextuais
Tokens de saída representam respostas geradas pelo modelo
Essa estrutura garante uma estimativa de custos transparente e previsível em todas as solicitações da Kimi API.
Eficiência de custos baseada em cache
O Kimi K2.6 também inclui um mecanismo de cache que ajuda a otimizar os custos de uso. Ao trabalhar com entradas repetidas ou semelhantes, tokens de entrada em cache são cobrados a uma tarifa reduzida, o que ajuda a diminuir o consumo total no modelo de preços da Kimi API.
Tokens de entrada em cache são cobrados com desconto
O contexto reutilizado reduz o consumo total de tokens
Aumenta a eficiência em sessões longas e fluxos de trabalho repetitivos
Isso torna os preços da API do Kimi K2.6 mais econômicos para cenários de produção em que prompts ou contextos são reutilizados com frequência.
Embora não haja um plano gratuito permanente da Kimi API para uso em produção, o modelo de preços foi projetado para se manter flexível e escalável, permitindo que desenvolvedores controlem custos com base no consumo real de tokens.
Planos de preços e faixas de uso do Kimi K2.6
Além dos preços de uso baseados em API, a Kimi oferece planos de assinatura em níveis que acompanham suas necessidades, facilitando a escolha do nível ideal para seu fluxo de trabalho. Esses planos permitem que os usuários escolham o nível mais adequado conforme suas necessidades de uso diário e requisitos de escala.
| Recurso | Adagio | Moderato | Allegretto | Allegro | Vivace |
|---|---|---|---|---|---|
| Cobrança anual (mensal efetivo) | US$ 0 / mês | US$ 15 / mês | US$ 31 / mês | US$ 79 / mês | US$ 159 / mês |
| Uso de Agent | 6 | 60 | 150 | 360 | 720 |
| Tarefas simultâneas | 1 tarefa | 2 tarefas | 2 tarefas | 4 tarefas | 4 tarefas |
| Fila prioritária do Agent | × | velocidade 4× | velocidade 4× | velocidade 4× | velocidade 4× |
| Agent Swarm | × | × | 50 usos incluídos | 120 usos incluídos | 240 usos incluídos |
| Subagents simultâneos | × | × | 4 subagents | 4 subagents | 8 subagents |
| Kimi Code | × | 1× créditos | 5× créditos | 15× créditos | 30× créditos |
| Kimi Claw | × | × | ✓ | ✓ | ✓ |
| Kimi Claw Android | × | × | ✓ | ✓ | ✓ |
| Kimi Claw (Mac ARM / PC) | × | × | ✓ | ✓ | ✓ |
| Chat em grupo com Claw | × | × | 10 chats | 10 chats | 10 chats |
| Solicitações profissionais de dados | 200 | 2000 | 5000 | 12000 | 24000 |
| Implantar site com banco de dados | × | ✓ | ✓ | ✓ | ✓ |
Conclusão
O Kimi K2.6 oferece preços flexíveis tanto para desenvolvedores quanto para usuários do dia a dia. A precificação da API baseada em tokens mantém os custos transparentes e previsíveis, com suporte a cache para reduzir despesas em fluxos de trabalho de alto volume ou com contextos longos. Para quem prefere acesso estruturado, os planos de assinatura em níveis vão do uso gratuito ao profissional, cobrindo recursos de agent, tarefas simultâneas e ferramentas como Kimi Claw e Agent Swarm. Seja integrando via API ou explorando todos os recursos da Kimi, há um plano pensado para se ajustar ao seu fluxo de trabalho e ao seu orçamento.