Kimi K2.7 Code 定价详解：API 费用与套餐

Q: Kimi K2.7 Code API 如何计费？

Kimi K2\.7 Code API 按 token 计费。每次请求都会消耗输入 token（你的提示词及上下文）和输出 token（模型生成的回答）。未命中缓存时，输入 token 按每 100 万 token ¥6.50 计费；命中缓存时，按每 100 万 token ¥1.30 计费。标准模型的输出 token 按每 100 万 token ¥27\.00 计费，高速版本按每 100 万 token ¥54\.00 计费。以上价格均不含适用税费。

Q: 上下文缓存能帮我节省多少费用？

复用此前处理过的上下文时，缓存输入 token 将按每 100 万 token ¥1\.30 计费，而非 ¥6\.50，重复上下文的输入成本可降低 80%。因此，对于长时间多轮编程会话、迭代调试流程，以及需要反复发送相似提示词或代码库上下文的场景，缓存尤其有效。

立即订阅

阅读时长：8 分钟2026-06-25

Kimi K2.7 Code 会员套餐与使用档位

如果你想直接在终端或 IDE 中使用 Kimi K2.7 Code，最简单的方式是订阅 Kimi Code。

	Andante	Moderato	Allegretto	Allegro
月费	¥49 / 月	¥99 / 月	¥199 / 月	¥699 / 月
说明	每周刷新使用配额，支持多设备登录，方便你在不同设备间共享套餐，并高效推进多个项目	充足的每周用量与更高并发上限，为进阶用户提供高性价比方案	为卓越体验而设计的宽裕配额，可从容覆盖日常任务到高强度开发	提供最高等级的每周套餐配额，助你轻松应对复杂项目和大型代码库

每个套餐都包含每周刷新的使用配额。更高档位提供更大的每周用量和更高并发上限，适合更高强度的项目需求。最新套餐详情请参见官方会员页面。

立即订阅

除了 Kimi Code，还包含哪些权益？

购买任一 Kimi Code 套餐，还可解锁更广泛的 Kimi 会员权益，主要由 Kimi K2.6 提供支持。

	Adagio	Andante	Moderato	Allegretto	Allegro
价格	¥0 / 月	¥49 / 月	¥99 / 月	¥199 / 月	¥699 / 月
智能体用量	6	30	60	150	360
智能体并发任务数	1 个任务	2 个任务	2 个任务	4 个任务	4 个任务
智能体优先队列	✗	4 倍速	4 倍速	4 倍速	4 倍速
Agent 集群	✗	✗	含 25 次使用	含 50 次使用	含 120 次使用
Agent 集群并发子智能体数	✗	2 个子智能体	4 个子智能体	4 个子智能体	8 个子智能体
Kimi Claw	✗	✗	✓	✓	✓
Kimi Claw Android	✗	✗	✓	✓	✓
Kimi Claw PC	✗	✗	✓	✓	✓
Claw 群聊	✗	✗	✗	10 个群聊	10 个群聊
部署带数据库的网站	✗	✓	✓	✓	✓
Kimi Work 活跃定时任务	2 个任务	6 个任务	10 个任务	15 个任务	20 个任务

这些跨产品权益适用于所有付费档位，并可与 Kimi K2.7 Code 一同使用；一份订阅即可同时获得专属编程 agent 和完整的 AI 工作空间。

立即订阅

Kimi K2.7 Code API 定价

Kimi K2.7 Code API 采用按 token 计费的定价模式，输入与输出处理均按每 1M tokens（1,000,000 tokens）计费，成本清晰可控、可预期。

模型	单位	输入价格（缓存命中）	输入价格（缓存未命中）	输出价格	上下文窗口
kimi-k2.7-code	1M tokens	¥1.30	¥6.50	¥27.00	262,144 tokens
kimi-k2.7-code-highspeed	1M tokens	¥2.60	¥13.00	¥54.00	262,144 tokens

标准版 kimi-k2.7-code 模型提供 Kimi 最强的编程智能，完整支持长上下文推理与智能体任务。kimi-k2.7-code-highspeed 版本输出速度约为 180 Tokens/s（短上下文场景最高可达 260 Tokens/s），为对延迟敏感的工作流带来极速编程体验。

获取 API 额度

Kimi K2.7 Code API 计费方式

Kimi K2.7 Code API 对每次请求采用按 token 计费的定价模式：与模型的每次交互都会消耗 token，并按 token 类型计费。在该模式下，token 通常分为三类：输入 token、输出 token 和缓存输入 token。

输入 token

输入 token 指发送给模型的全部内容，包括：

用户提示词
系统指令
对话历史或上下文

这些 token 决定了模型在生成回复前需要处理多少上下文。

缓存输入 token

缓存输入 token 是指复用此前已处理过的上下文时产生的 token。

如果复用相同或相似的上下文，即可按更低成本提供服务
这能显著提升重复性工作流的效率
尤其适用于长上下文应用或多轮交互

输出 token

输出 token 是模型响应请求时生成的 token，代表实际由 AI 生成的内容，例如：

代码生成
文本回复
结构化输出

由于生成输出需要额外计算，输出 token 的价格通常高于输入 token。

获取 API 额度

总结

Kimi K2.7 Code 提供透明且灵活的定价结构，可从个人开发项目平滑扩展到大规模生产负载。通过按 token 计费、缓存优惠和高速模型选项，开发者可以根据具体需求在性能与成本之间取得平衡，从而更轻松地构建、测试和部署 AI 驱动的编程工作流，同时保持支出可预期。

常见问题

Kimi K2.7 Code API 如何计费？

Kimi K2.7 Code API 按 token 计费。每次请求都会消耗输入 token（你的提示词及上下文）和输出 token（模型生成的回答）。未命中缓存时，输入 token 按每 100 万 token ¥6.50 计费；命中缓存时，按每 100 万 token ¥1.30 计费。标准模型的输出 token 按每 100 万 token ¥27.00 计费，高速版本按每 100 万 token ¥54.00 计费。以上价格均不含适用税费。

上下文缓存能帮我节省多少费用？

复用此前处理过的上下文时，缓存输入 token 将按每 100 万 token ¥1.30 计费，而非 ¥6.50，重复上下文的输入成本可降低 80%。因此，对于长时间多轮编程会话、迭代调试流程，以及需要反复发送相似提示词或代码库上下文的场景，缓存尤其有效。

我应该使用 API，还是选择 Kimi 会员套餐？

如果你正在构建自定义工具、CI/CD 流水线或内部开发者平台，需要以编程方式接入并精细控制 token 消耗，请使用 API。如果你希望无需管理 API key 或预估 token 用量，即可在终端和 IDE 中通过 Kimi Code 立即使用，建议选择 Kimi 会员套餐（¥49/月起）。会员套餐包含每周刷新的 Kimi Code 额度；更高档位可解锁更多额度和更高并发。

Kimi K2.7 Code API 定价适合企业级使用吗？

可以。基于 token 的计费模式可从个人开发者平滑扩展到企业级部署，且没有使用量上限。对于高用量场景，在不同会话中复用相似输入时，自动上下文缓存机制可显著降低成本。如需定制企业条款、专属支持或大客户折扣，请通过 Kimi API Platform 联系 Kimi 销售团队。