Kimi | ChatGPT 综述

Slides
Websites
Docs
Deep Research
Sheets
Agent Swarm

Kimi Claw

Chat History

Get App
About Us
Language
Get Help

Lock Sidebar

ChatGPT 综述

总结这篇文章的要点： https://mp.weixin.qq.com/s/Bhn43P1GnGXsvsh5MnN47Q

打开链接获取内容并提炼要点

用户希望我总结一篇微信公众号文章的内容。我需要先打开这个链接来获取文章内容，然后总结要点。

链接是：https://mp.weixin.qq.com/s/Bhn43P1GnGXsvsh5MnN47Q

我应该使用 web_open_url 工具来访问这个链接。

我来帮你获取并总结这篇文章的内容。

Fetch URLs

1 pages

Kimi K2.5开源多模模型

文章已成功获取，这是关于Kimi K2.5模型发布的官方文章。我需要总结这篇文章的主要要点。

文章主要内容：

Kimi K2.5模型发布并开源，是最智能和全能的模型
在Agent、代码、图像、视频等任务上取得开源SOTA表现
原生多模态架构，支持视觉与文本输入、思考与非思考模式、对话与Agent任务
引入Agent集群能力，可创建分身并行工作
发布Kimi Code编程助手工具
性能对比图表显示在多个benchmark上超越GPT-5.2、Claude Opus 4.5、Gemini 3 Pro等
四种使用模式：快速模式、思考模式、Agent模式、Agent集群模式

我需要组织一个清晰的总结，涵盖：

核心发布（K2.5模型）
主要能力特点
Agent集群创新
Kimi Code工具
性能表现
使用渠道

让我整理一下要点。

这篇文章介绍了Kimi K2.5 模型的正式发布与开源，核心要点如下：

1. 模型定位

Kimi 迄今最智能、最全能的模型，采用原生多模态架构
在 Agent、代码、图像、视频及通用智能任务上取得开源 SOTA（state-of-the-art）表现
同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务

2. 核心能力提升

视觉 + 代码融合：支持通过拍照、截图或录屏直接生成/复现前端代码，降低编程门槛
办公自动化：Agent 能力扩展到 Word、Excel、PPT、PDF 等日常办公软件，可交付准专业水平文档
多模态理解：在 MMMU Pro、MathVision、VideoMMMU 等视觉/视频理解基准上表现优异

3. Agent 集群（Agent Swarm）创新

从单兵作战到团队协作：K2.5 可根据任务需求自主创建多达 100 个"分身"，组成不同角色的专业团队并行工作
效率提升：相比单 Agent，在复杂任务中关键步骤减少 3-4.5 倍，实际运行时间最高缩短 4.5 倍
自主决策：角色分配与任务拆解无需预设，由 K2.5 现场决策，可并行处理 1500 个步骤

4. Kimi Code 正式发布

编程助手套件：支持 CLI 命令行、VS Code/Cursor/JetBrains/Zed 等主流编辑器插件
多模态编程：可直接输入图片和视频进行编程辅助
性能表现：在内部基准 Kimi Code Bench 上得分 57.4，较 K2 Thinking（43.7）大幅提升

5. 性能对比

在多个权威基准测试中，K2.5 超越 GPT-5.2 (xhigh)、Claude Opus 4.5、Gemini 3 Pro 等闭源模型：

Agent 任务：Humanity's Last Exam、BrowseComp、DeepSearchQA 领先
代码能力：SWE-bench Verified 和 Multilingual 得分 76.8/80.9
视觉理解：MMMU Pro 78.5、MathVision 84.2

6. 使用方式

已上线以下渠道，提供四种模式（快速/思考/Agent/Agent集群）：

网页端：kimi.com
移动端：Kimi App
API：platform.moonshot.cn
编程工具：kimi.com/code（支持会员包月计划）

7. 开源信息

K2.5 模型已开源发布
Kimi Code 背后的 Agent SDK 也将在 GitHub 开源（仓库地址：https://github.com/MoonshotAI/kimi-agent-sdk）