Agent 功能与使用限制

Agent 使用建议

提交任务前:明确背景信息与限制条件,明确项目背景、使用场景、特殊需求等,帮助 Kimi更准确理解意图

执行过程中:Kimi Agent 在后台异步执行,如果在网页版显示停止/卡顿,不要点击“停止输出”,这会中断任务执行。可离开页面,任务将在后台继续运行,完成后系统会发送通知。对于预期执行时间较长的任务(如 Agent Swarm),请耐心等待。

多轮对话与任务调整:在多轮对话和修改过程中,Agent 可能会“遗忘”初期的部分细节,建议先梳理任务框架和重点,再进行局部调整。

大型任务拆分:对于大型复杂任务,建议拆分为 2-3 个阶段,分批提交给 Kimi,或使用 Swarm Agent。

文件输出限制:在通用 Agent 场景中,通常一次只能输出一个文件(如文档或表格)。如需多个文件(例如输出 Word 和 PPT),请使用 Agent Swarm。

上下文限制与输出平衡:Agent 的上下文窗口为 128K tokens,约可容纳 10 万汉字的内容。在处理大量文件时,需要同时考虑输入与输出的平衡。

注意事项

  • 执行时长:Agent 模式下,单次执行任务需要 5-20 分钟,Agent Swarm 可能需要更长时间。可以离开当前页面,勿点击停止中断任务。
  • 额度使用:使用 Agent 执行任务会根据实际 token 消耗扣除统一额度。
  • 简单任务建议:对于简单问答,推荐使用普通对话模式,可获得更快速的响应。
  • 内容合规:Agent 功能须遵守Kimi 用户协议,不支持生成违规内容。如输入违规内容,Kimi 将暂停或停止服务。

常见问题

Q:Agent 能做什么?

Agent 通过调用多种工具满足以下需求:

  • 文本生成与编辑:生成文章、报告、文档等,支持多种写作风格和格式。
  • 网页开发:编写 HTML,支持 APP 界面设计、网页部署、数据可视化等。
  • PPT 生成:拥有独立的网页版 PPT 工具,可生成完整演示文稿。
  • 辅助编程:支持多种编程语言的代码编写与调试。

Q:为什么 Agent 做出来的网页不能用?

一个完整的网页通常包含前端界面、后端服务和数据存储三部分。 2026年4月,Agent与网站已经升级全栈能力。 若需求涉及用户登录、数据存储、动态交互等后端功能,Agent 已经支持。

但在执行任务时,需要明确指出需要Agent完成的部分。

功能参考

功能说明
对话式建站用自然语言描述需求,AI 自动生成网站
图片/视频理解上传设计图/截图/录屏,AI 自动解析并生成 HTML 页面
全栈预览支持前后端完整预览,部分场景需手动启动沙盒环境
持久化存储自动构建后端数据库,支持数据持久化存储与管理
用户登录内置用户认证系统,支持 Kimi 账号登录(更多登录方式即将上线)
版本管理AI 自动进行版本提交,支持回退到任意历史版本
多轮修改支持网页版本多轮修改,并查看不同版本效果
一键发布手动发布后部署到公网可访问地址,未发布前仅限预览
代码导出支持打包下载完整项目文件,自主部署

Q:Agent 的任务交付物是什么?

  • 完整的任务执行文件
  • 部署好的网页
  • 可下载的 Zip 包(位于 /mnt/okcomputer/output/ 目录)

Q:Agent 的上下文长度是多少?

Agent 使用的 上下文长度(context length)为 128K tokens(约 8–10 万汉字)。

Token 是大语言模型处理文本的基本单位,不等于字数——一个汉字通常对应 1.5–2 个 token,一个英文单词约对应 1–2 个 token。如需精确估算,可使用Kimi 开放平台 Token 估算接口

上下文窗口包含 Agent 在一次任务中能“看到”的所有内容,包括:你的指令、Agent 调用工具的过程记录、工具返回的结果、以及 Agent 自身的输出。当任务涉及大量网页抓取、文件读取或多步工具调用时,上下文会消耗得更快。

如果任务内容超出上下文限制,Agent 将无法处理超出部分,建议将长文档拆分后分步处理。