Planos de assinatura e faixas de uso do Kimi K2.7 Code
Se você quer usar o Kimi K2.7 Code diretamente no terminal ou na IDE, o caminho mais simples é uma assinatura Kimi Code.
| Moderato | Allegretto | Allegro | Vivace | |
|---|---|---|---|---|
| Preço mensal | $19 / mês | $39 / mês | $99 / mês | $199 / mês |
| Descrição | Cotas de uso renovadas semanalmente com login em vários dispositivos, permitindo compartilhar seu plano entre dispositivos e trabalhar com eficiência em vários projetos | Limites semanais amplos e maior capacidade de concorrência, oferecendo uma solução de alto valor para usuários avançados | Cota ampla, projetada para alto desempenho. Lida sem esforço com tudo, das tarefas diárias ao desenvolvimento intensivo | Oferece nossas maiores cotas semanais de plano, permitindo lidar com projetos complexos e grandes bases de código com facilidade |
Cada plano inclui cotas de uso renovadas semanalmente. Categorias superiores oferecem limites semanais maiores e maior capacidade de concorrência, sendo adequadas para projetos mais exigentes. Para ver os detalhes mais recentes dos planos, consulte a página oficial de assinatura.
O que está incluído além do Kimi Code?
Ao comprar qualquer plano Kimi Code, você também desbloqueia os benefícios mais amplos da assinatura Kimi, impulsionados principalmente pelo Kimi K2.6.
| Adagio | Moderato | Allegretto | Allegro | Vivace | |
|---|---|---|---|---|---|
| Preço | $0 | $19 / mês | $39 / mês | $99 / mês | $199 / mês |
| Uso do Agent | 6 | 60 | 150 | 360 | 720 |
| Tarefas simultâneas do Agent | 1 tarefa | 2 tarefas | 2 tarefas | 4 tarefas | 4 tarefas |
| Fila prioritária do Agent | ✗ | velocidade 4x | velocidade 4x | velocidade 4x | velocidade 4x |
| Agent Swarm | ✗ | 25 usos incluídos | 50 usos incluídos | 120 usos incluídos | 240 usos incluídos |
| Subagents simultâneos do Agent Swarm | ✗ | 2 subagents | 4 subagents | 4 subagents | 8 subagents |
| Kimi Claw | ✗ | ✗ | ✓ | ✓ | ✓ |
| Kimi Claw Android | ✗ | ✗ | ✓ | ✓ | ✓ |
| Kimi Claw PC | ✗ | ✗ | ✓ | ✓ | ✓ |
| Chat em grupo com Claw | ✗ | ✗ | 10 chats em grupo | 10 chats em grupo | 10 chats em grupo |
| Implantar um site com banco de dados | ✗ | ✓ | ✓ | ✓ | ✓ |
| Tarefas agendadas ativas do Kimi Work | 2 tarefas | 10 tarefas | 15 tarefas | 20 tarefas | 20 tarefas |
Esses benefícios entre produtos estão disponíveis em todos os planos pagos junto com o uso do Kimi K2.7 Code, reunindo em uma única assinatura um agent dedicado à programação e um workspace completo de IA.
Preços da API Kimi K2.7 Code
Os preços da API Kimi K2.7 Code usam um modelo baseado em token, com cobrança por 1M de tokens (1.000.000 tokens) tanto para processamento de entrada quanto de saída, permitindo um controle de custos claro e previsível.
| Modelo | Unidade | Preço de entrada (cache hit) | Preço de entrada (cache miss) | Preço de saída | Janela de contexto |
|---|---|---|---|---|---|
| kimi-k2.7-code | 1M de tokens | $0.19 | $0.95 | $4.00 | 262.144 tokens |
| kimi-k2.7-code-highspeed | 1M de tokens | $0.38 | $1.90 | $8.00 | 262.144 tokens |
O modelo padrão kimi-k2.7-code entrega o desempenho de programação mais inteligente da Kimi, com suporte completo a raciocínio em contexto longo e tarefas agenticas. A variante kimi-k2.7-code-highspeed oferece velocidade de saída de aproximadamente 180 Tokens/s (até 260 Tokens/s em cenários de contexto curto), proporcionando uma experiência extrema de programação para fluxos de trabalho sensíveis à latência.
Como funciona a cobrança da API Kimi K2.7 Code
A API Kimi K2.7 Code usa um modelo de preços baseado em token para cada solicitação, em que cada interação com o modelo consome tokens cobrados de acordo com seu tipo. Nesse modelo, os tokens geralmente são classificados em três tipos: tokens de entrada, tokens de saída e tokens de entrada em cache.
Tokens de entrada
Tokens de entrada representam tudo o que é enviado ao modelo, incluindo:
Prompts do usuário
Instruções do sistema
Histórico da conversa ou contexto
Esses tokens determinam quanto contexto o modelo precisa processar antes de gerar uma resposta.
Tokens de entrada em cache
Tokens de entrada em cache ocorrem quando um contexto processado anteriormente é reutilizado.
Se o mesmo contexto, ou um contexto semelhante, for reutilizado, ele poderá ser servido a um custo reduzido
Isso melhora significativamente a eficiência em fluxos de trabalho repetitivos
É especialmente útil em aplicações de contexto longo ou interações em múltiplos turnos
Tokens de saída
Tokens de saída são gerados pelo modelo em resposta a uma solicitação. Eles representam o conteúdo efetivamente gerado por IA, como:
Geração de código
Respostas em texto
Saídas estruturadas
Como a geração de saída exige computação adicional, normalmente ela custa mais do que os tokens de entrada.
Conclusão
Kimi K2.7 Code oferece uma estrutura de preços transparente e flexível, capaz de escalar de projetos individuais de desenvolvimento a grandes cargas de trabalho em produção. Com cobrança baseada em token, descontos por cache e uma opção de modelo de alta velocidade, os desenvolvedores podem equilibrar desempenho e custo conforme suas necessidades específicas. Isso facilita criar, testar e implantar fluxos de trabalho de programação com IA mantendo os gastos previsíveis.