会话是一切的起点
你可以在对话框中输入问题、上传文件,或根据需要切换不同模型。
打开 kimi.com,试着发送一条消息,和 Kimi 打个招呼吧:
Text
默认搭载 K2.6 模型
Kimi K2.6 开源模型在 Kimi K2.5 基础上实现全面升级,聚焦长程编码、智能体集群与主动式代理等能力,在编码、长程执行及一系列通用智能任务上达到开源领域最先进水平(state-of-the-art)。Kimi K2.6 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。
因此,Kimi 除了擅长问答对话,还能够自主规划任务、调用工具并完成多步推理,支持复杂任务的深度思考与执行。
K2.6 内置官方工具
无需额外配置即可使用:
视觉与多模态能力
K2.6 支持图片、视频、PDF/Word/Excel 等办公文档的全场景理解,采用原生多模态架构(非外挂 OCR),可直接解析文档内容并执行中高阶办公操作(如编写 Excel 公式、生成 PPT 大纲/VBA 代码)。
多模态输入支持
- 图片:PNG、JPEG、WebP、GIF 等(支持 URL、Base64、本地文件)
- 视频:MP4 等(支持 video_url 或图像序列帧 + fps 参数)
- 文档:PDF、Word、Excel、TXT、Markdown 等
- 在线资源:URL(统一资源定位符)、公众号文章链接
- 以图搜图:上传图片,调用图像检索工具搜索相关或相似图片
- 视频理解:支持视频理解,可分析录屏内容并复现交互逻辑
- 视觉编程:支持上传截图或录屏生成前端代码(HTML/Vue/React 等),可基于设计稿自动还原网页
会话输出格式
- 纯文本 / 图文混排:常规对话回复
- Markdown:富文本、标题、列表、表格、链接
- 代码块:HTML/Vue/React/Python/JSON/Mermaid 等(带语言标识)
- JSON 结构化数据:强制 JSON 模式输出
- Mermaid 图表:流程图、时序图、思维导图等语法
- LaTeX 数学公式:行内和块级数学表达式
- 双模式输出(Thinking):同时返回
reasoning_content(思考过程)和content(最终答案) - 工具调用格式:Function Calling 标准格式(面向开发者)
注意事项
- 生图限制:标准会话模式下仅支持搜索图片,不支持直接生成图像(生图功能需使用 Agent 模式)
- 文件输出限制:仅支持输出文本内容(如 PPT 大纲、Word 正文、代码等),不支持直接输出二进制文件(如
.pptx、.docx、.xlsx、.pdf) - 如需使用生图功能或生成复杂可编辑文档,请使用 Agent 模式 或配合代码执行工具。
会话 vs. 对话轮次
当你点击“新建会话”,想象你与 Kimi 进行一场长谈。
关键区别
会话(Session)
- 记忆连续性:Kimi 记得本轮聊天中的所有上下文
- 跨轮次关联:每次回复都会参考前面的对话内容,作为新一轮对话的上下文
- 有始有终:点击“新建会话”= 重新开始,历史上下文清空
对话轮次(Turn)
- 累计计数:第 1 轮、第 2 轮……逐轮累加
- 记忆有限:轮次过多(如超过 50 轮)可能导致“遗忘”早期内容,尤其是长篇小说创作、有明确限制和要求的场景
- 受限于上下文长度:受 Token(字数)限制,轮次过多时最早的内容可能被压缩
极端情况:如果一问一答就结束,那么 1 个对话轮次 = 1 次会话。
为什么需要区分这两个概念
在同一个会话中,每次你输入了新的问题/指令,Kimi 当前轮次回复都会参考前面的对话轮次。当对话轮次过多、内容积累过长时,回答质量可能会有所下降。
典型场景
场景 1:开始新话题
在一个写了 3 万字小说的会话里突然问“帮我算个税”
新建一个会话问税务问题,避免 Kimi 把小说角色与税法概念进行混淆
场景 2:长文档处理
- 当你在一个会话里聊了几十轮后,AI 可能“遗忘”最开始设定的规则或上传的文件摘要
- 对策:重要任务中途主动总结(“总结一下我们目前的方案”),或开启新会话
场景 3:理解产品限制
- 上下文长度限制通常按 Token(字数)计算,但通俗理解就是“轮次”
- 如果看到“新开会话”提示,意味着当前会话轮次太多,需要新开会话
使用建议
- 每个任务单独新建会话:每个独立任务,如写论文、查资料、编程调试等,各自新建会话,避免上下文相互干扰
- 长会话定期总结:超过 20 轮对话后,主动让 AI 总结关键信息,防止信息丢失
- 敏感信息及时清理:会话历史会保留,涉及隐私的内容完成后可删除整个会话