Kimi K2.6 是一款开源模型,具备顶尖的编程、长程执行和 agent 集群能力。以下是 Kimi API 价格与 Kimi 会员方案概览。
Kimi K2.6 API 价格概览
Kimi K2.6 API 采用基于 token 的计价模型,输入与输出处理均按每 1M tokens(1,000,000 tokens)计费,让成本控制清晰且可预测。
| 模型 | 单位 | 输入价格(缓存命中) | 输入价格(缓存未命中) | 输出价格 | 上下文窗口 |
|---|---|---|---|---|---|
| kimi-k2.6 | 1M tokens | $0.16 | $0.95 | $4.00 | 262,144 tokens |
Kimi K2.6 API 定价模型
Kimi K2.6 API 对每次请求采用基于 token 的计价模型:与模型的每一次交互都会消耗 token,并按 token 类型计费。在该模型中,token 通常分为三类:输入 token、输出 token 和缓存输入 token。
输入 token
输入 token 指发送给模型的全部内容,包括:
用户提示词
系统指令
对话历史或上下文
这些 token 决定了模型在生成回复前需要处理多少上下文。
输出 token
输出 token 是模型为响应请求而生成的内容。它们代表实际由 AI 生成的内容,例如:
文本回复
代码生成
结构化输出
由于输出生成需要额外计算,通常其价格高于输入 token。
缓存输入 token
当此前处理过的上下文被复用时,就会产生缓存输入 token。
如果复用相同或相似的上下文,就可以以更低成本提供服务
这能显著提升重复性工作流的效率
尤其适用于长上下文应用或多轮交互
Kimi K2.6 API 定价说明
Kimi K2.6 API 价格采用透明的按量计费模式。以下列出几项重要说明,帮助开发者更好地理解计费方式和成本变化。
税费与账单政策
Kimi K2.6 API 标示价格均不含适用税费。税费会在结账时根据用户的账单地区和当地税务要求自动计算,确保每笔订单的发票准确且合规。
token 用量说明
为便于理解 Kimi K2.6 API 价格,计费采用统一的 token 标准:
1M tokens = 1,000,000 tokens
输入 token 包括提示词和上下文信息
输出 token 代表模型生成的回复
这种结构可确保所有 Kimi API 请求的成本估算透明且可预测。
基于缓存的成本优化
Kimi K2.6 还内置缓存机制,可帮助优化使用成本。处理重复或相似输入时,缓存输入 token 按较低价格计费,从而在 Kimi API 定价模型下降低总体消耗。
缓存输入 token 按折扣价格计费
复用上下文可减少 token 总消耗
提升长会话和重复性工作流的效率
因此,对于提示词或上下文经常被复用的生产场景,Kimi K2.6 API 价格更具成本效益。
虽然 Kimi API 没有面向生产使用的永久免费套餐,但其定价模型保持灵活、可扩展,开发者可根据实际 token 消耗控制成本。
Kimi K2.6 的价格方案与用量档位
除 API 按量计费外,Kimi 还提供可随需求扩展的分级会员方案,让你能轻松为工作流选择合适档位。用户可根据日常使用需求和扩展规模选择最适合的方案。
| 功能 | Adagio | Moderato | Allegretto | Allegro | Vivace |
|---|---|---|---|---|---|
| 年付(折合月费) | $0 / 月 | $15 / 月 | $31 / 月 | $79 / 月 | $159 / 月 |
| Agent 使用 | 6 | 60 | 150 | 360 | 720 |
| 并发任务 | 1 个任务 | 2 个任务 | 2 个任务 | 4 个任务 | 4 个任务 |
| Agent 优先队列 | × | 4× 速度 | 4× 速度 | 4× 速度 | 4× 速度 |
| Agent 集群 | × | × | 含 50 次使用 | 含 120 次使用 | 含 240 次使用 |
| 并发子 Agent | × | × | 4 个子 Agent | 4 个子 Agent | 8 个子 Agent |
| Kimi Code | × | 1× 额度 | 5× 额度 | 15× 额度 | 30× 额度 |
| Kimi Claw | × | × | ✓ | ✓ | ✓ |
| Kimi Claw Android | × | × | ✓ | ✓ | ✓ |
| Kimi Claw (Mac ARM / PC) | × | × | ✓ | ✓ | ✓ |
| Claw 群聊 | × | × | 10 次聊天 | 10 次聊天 | 10 次聊天 |
| 专业数据请求 | 200 | 2000 | 5000 | 12000 | 24000 |
| 部署带数据库的网站 | × | ✓ | ✓ | ✓ | ✓ |
总结
Kimi K2.6 为开发者和日常用户都提供了灵活的价格方案。按 token 计费的 API 价格透明、可预测,并支持缓存,可在高用量或长上下文工作流中降低成本。对于希望按固定结构使用的用户,分级会员方案从免费到专业用途均可覆盖,包含 Agent 能力、并发任务,以及 Kimi Claw、Agent 集群等工具。无论你是通过 API 集成,还是想探索 Kimi 的完整功能,都能找到契合工作流和预算的方案。