会话是一切的起点

你可以在对话框中输入问题、上传文件，或根据需要切换不同模型。

打开 kimi.com，试着发送一条消息，和 Kimi 打个招呼吧：

Text

选择模型

Kimi提供多种模型选择，点击输入框上方的模型切换按钮，即可切换。

模型	思考强度	擅长场景
K2.6	标准 / 进阶	快速对话与问答，响应更快
K3	标准 / 进阶 / 极致	对话与 Agent 任务，综合能力最强
K3 集群	标准 / 进阶 / 极致	海量搜索、批量处理，一次性完成大规模任务

K2.6 不消耗会员额度；K3 与 K3 集群按额度计费，详见会员权益说明。

关于 Kimi K3

Kimi K3 是 Kimi 现在功能最强大的模型，拥有 2.8 万亿参数，基于 Kimi Delta Attention（KDA）与 Attention Residuals 构建，具备原生视觉功能和 100 万 token 上下文窗口。作为全球首个开放式 3T 级模型，K3 专为长程编码、知识工作与推理等前沿智能场景设计，在编码、长程执行及一系列通用智能任务上达到领先水平。

内置官方工具

无需额外配置即可使用：

工具	功能说明
Web Search	实时联网搜索，获取最新资讯与动态
Fetch Tool	定向访问指定 URL（网页、文档、图片等在线资源）
Image Search	以文搜图、以图搜图，快速定位视觉内容
IPython	执行 Python 代码，进行数据与可视化分析
Memory	智能记忆功能，记录你的个人习惯与偏好设置

视觉与多模态能力

Kimi K3 支持图片、视频、PDF/Word/Excel 等办公文档的全场景理解，采用原生多模态架构（非外挂 OCR），可直接解析文档内容并执行中高阶办公操作（如编写 Excel 公式、生成 PPT 大纲/VBA 代码）。配合原生视觉能力与 100 万 token 上下文，可处理更长、更复杂的多模态材料。

多模态输入支持

图片：PNG、JPEG、WebP、GIF 等（支持 URL、Base64、本地文件）
视频：MP4 等（支持 video_url 或图像序列帧 + fps 参数）
文档：PDF、Word、Excel、TXT、Markdown 等
在线资源：URL（统一资源定位符）、公众号文章链接
以图搜图：上传图片，调用图像检索工具搜索相关或相似图片
视频理解：支持视频理解，可分析录屏内容并复现交互逻辑
视觉编程：支持上传截图或录屏生成前端代码（HTML/Vue/React 等），可基于设计稿自动还原网页

会话输出格式

纯文本 / 图文混排：常规对话回复
Markdown：富文本、标题、列表、表格、链接
代码块：HTML/Vue/React/Python/JSON/Mermaid 等（带语言标识）
JSON 结构化数据：强制 JSON 模式输出
Mermaid 图表：流程图、时序图、思维导图等语法
LaTeX 数学公式：行内和块级数学表达式
双模式输出（Thinking）：同时返回 reasoning_content（思考过程）和 content（最终答案）
工具调用格式：Function Calling 标准格式（面向开发者）

注意事项

文件产出：K3 可端到端产出可编辑文档（如 .pptx、.docx、.xlsx、.pdf）等复杂结果；K2.6 偏快速问答，仅输出文本内容（如 PPT 大纲、Word 正文、代码等）。

小提示：如需图片生成、音频生成、视频生成，可点击「+」→ 插件（Plugin），选择对应功能后在 K3 中使用；如需生成复杂可编辑文档或执行多步任务，推荐选择 K3 或 K3 集群，体验更完整。

会话 vs. 对话轮次

当你点击“新建会话”，想象你与 Kimi 进行一场长谈。

概念	通俗类比	技术定义
会话（Session）	整场见面（从开始交谈到交谈结束）	一次完整的聊天过程，有明确的开始和结束
对话轮次（Turn）	一轮交锋（你说一句，Kimi 答一句）	你的输入（Input）与 Kimi 的回复（Response）组成一个来回

关键区别

会话（Session）

记忆连续性：Kimi 记得本轮聊天中的所有上下文
跨轮次关联：每次回复都会参考前面的对话内容，作为新一轮对话的上下文
有始有终：点击“新建会话”= 重新开始，历史上下文清空

对话轮次（Turn）

累计计数：第 1 轮、第 2 轮……逐轮累加
记忆有限：轮次过多（如超过 50 轮）可能导致“遗忘”早期内容，尤其是长篇小说创作、有明确限制和要求的场景
受限于上下文长度：受 Token（字数）限制，轮次过多时最早的内容可能被压缩

极端情况：如果一问一答就结束，那么 1 个对话轮次 = 1 次会话。

为什么需要区分这两个概念

在同一个会话中，每次你输入了新的问题/指令，Kimi 当前轮次回复都会参考前面的对话轮次。当对话轮次过多、内容积累过长时，回答质量可能会有所下降。

典型场景

场景 1：开始新话题

在一个写了 3 万字小说的会话里突然问“帮我算个税”

新建一个会话问税务问题，避免 Kimi 把小说角色与税法概念进行混淆

场景 2：长文档处理

当你在一个会话里聊了几十轮后，AI 可能“遗忘”最开始设定的规则或上传的文件摘要
对策：重要任务中途主动总结（“总结一下我们目前的方案”），或开启新会话

场景 3：理解产品限制

上下文长度限制通常按 Token（字数）计算，但通俗理解就是“轮次”
如果看到“新开会话”提示，意味着当前会话轮次太多，需要新开会话

使用建议

每个任务单独新建会话：每个独立任务，如写论文、查资料、编程调试等，各自新建会话，避免上下文相互干扰。

长会话定期总结：超过 20 轮对话后，主动让 AI 总结关键信息，防止信息丢失。

敏感信息及时清理：会话历史会保留，涉及隐私的内容完成后可删除整个会话。