Agent 功能与使用限制
Agent 使用建议
提交任务前:明确背景信息与限制条件,明确项目背景、使用场景、特殊需求等,帮助 Kimi更准确理解意图
执行过程中:Kimi Agent 在后台异步执行,如果在网页版显示停止/卡顿,不要点击“停止输出”,这会中断任务执行。可离开页面,任务将在后台继续运行,完成后系统会发送通知。对于预期执行时间较长的任务(如 Agent Swarm),请耐心等待。
多轮对话与任务调整:在多轮对话和修改过程中,Agent 可能会“遗忘”初期的部分细节,建议先梳理任务框架和重点,再进行局部调整。
大型任务拆分:对于大型复杂任务,建议拆分为 2-3 个阶段,分批提交给 Kimi,或使用 Swarm Agent。
文件输出限制:在通用 Agent 场景中,通常一次只能输出一个文件(如文档或表格)。如需多个文件(例如输出 Word 和 PPT),请使用 Agent Swarm。
上下文限制与输出平衡:Agent 的上下文窗口为 128K tokens,约可容纳 10 万汉字的内容。在处理大量文件时,需要同时考虑输入与输出的平衡。
注意事项
- 执行时长:Agent 模式下,单次执行任务需要 5-20 分钟,Agent Swarm 可能需要更长时间。可以离开当前页面,勿点击停止中断任务。
- 额度使用:使用 Agent 执行任务会根据实际 token 消耗扣除统一额度。
- 简单任务建议:对于简单问答,推荐使用普通对话模式,可获得更快速的响应。
- 内容合规:Agent 功能须遵守Kimi 用户协议,不支持生成违规内容。如输入违规内容,Kimi 将暂停或停止服务。
常见问题
Q:Agent 能做什么?
Agent 通过调用多种工具满足以下需求:
- 文本生成与编辑:生成文章、报告、文档等,支持多种写作风格和格式。
- 网页开发:编写 HTML,支持 APP 界面设计、网页部署、数据可视化等。
- PPT 生成:拥有独立的网页版 PPT 工具,可生成完整演示文稿。
- 辅助编程:支持多种编程语言的代码编写与调试。
Q:为什么 Agent 做出来的网页不能用?
一个完整的网页通常包含前端界面、后端服务和数据存储三部分。 2026年4月,Agent与网站已经升级全栈能力。 若需求涉及用户登录、数据存储、动态交互等后端功能,Agent 已经支持。
但在执行任务时,需要明确指出需要Agent完成的部分。
功能参考
Q:Agent 的任务交付物是什么?
- 完整的任务执行文件
- 部署好的网页
- 可下载的 Zip 包(位于
/mnt/okcomputer/output/目录)
Q:Agent 的上下文长度是多少?
Agent 使用的 上下文长度(context length)为 128K tokens(约 8–10 万汉字)。
Token 是大语言模型处理文本的基本单位,不等于字数——一个汉字通常对应 1.5–2 个 token,一个英文单词约对应 1–2 个 token。如需精确估算,可使用Kimi 开放平台 Token 估算接口
上下文窗口包含 Agent 在一次任务中能“看到”的所有内容,包括:你的指令、Agent 调用工具的过程记录、工具返回的结果、以及 Agent 自身的输出。当任务涉及大量网页抓取、文件读取或多步工具调用时,上下文会消耗得更快。
如果任务内容超出上下文限制,Agent 将无法处理超出部分,建议将长文档拆分后分步处理。