在这两天贴近真实环境的测试中,Kimi 确确实实地展现出了接近国际顶尖模型的 Agent / Coding 能力。
它的进步在两个关键维度上肉眼可见:
1. 代码能力不再是短板:无论是一次成型的 3D 动态山脉,还是准确理解上万字长文并生成 Bento Grid 风格一图流,Kimi K2 的代码生成质量和审美,都完全不输 Claude 和 Gemini。这直接打破了我对国产模型“不擅代码、审美糟糕”的刻板印象。
2. Agent 能力更是惊喜:在「Chat Memo」项目的真实迭代需求测试中,Kimi K2 仅凭 Claude Code 这个未经适配的 Agent 外壳,达到了需要 Trae + Claude 多轮 Prompt 才取得的同等开发结果。
## 任务
我是 AI 科技评测博主,中立客观。请阅读我的文章中的要点,帮我生成一个好看的配图,具体要求为:
- 尽量在一页展示全部信息,背景为白色、文字和按钮颜色为纯黑色,高亮色为#4D6BFE
- 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差
- 网页需要以响应式兼容更大的显示器宽度比如1920px及以上
- 中英文混用,中文大字体粗体,英文小字作为点缀
- 简洁的勾线图形化作为数据可视化或者配图元素
- 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变
- 数据可以引用在线的图表组件,样式需要跟主题一致
- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
- 避免使用emoji作为主要图标
- 不要省略内容要点
HTML
Preview
Copy
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Kimi K2 能力评测报告</title>
<script src="https://cdn.tailwindcss.com"></script>
<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.5.1/css/all.min.css">
<script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
<style>
@import url('https://fonts.googleapis.com/css2?family=Noto+Sans+SC:wght@400;700;900&family=Inter:wght@300;400;500&display=swap');
:root {
--highlight: #4D6BFE;
}
body {
font-family: 'Noto Sans SC', sans-serif;
background: white;
overflow-x: hidden;
}
.hero-title {
font-family: 'Noto Sans SC', sans-serif;
font-weight: 900;
line-height: 0.8;
}
.eng-caption {
font-family: 'Inter', sans-serif;
font-weight: 300;
}
.highlight-gradient {
background: linear-gradient(135deg, rgba(77, 107, 254, 0.1) 0%, rgba(77, 107, 254, 0.05) 100%);
}
.tech-border {
border: 2px solid var(--highlight);
position: relative;
}
.tech-border::before {
content: '';
position: absolute;
inset: -2px;
border: 1px solid var(--highlight);
opacity: 0.3;
animation: pulse 2s infinite;
}
@keyframes pulse {
0%, 100% { opacity: 0.3; transform: scale(1); }
50% { opacity: 0.1; transform: scale(1.02); }
}
.giant-number {
font-size: clamp(8rem, 20vw, 20rem);
font-weight: 900;
color: var(--highlight);
opacity: 0.1;
position: absolute;
z-index: 0;
}
.metric-card {
backdrop-filter: blur(10px);
background: rgba(255, 255, 255, 0.9);
}
.chart-container {
position: relative;
height: 200px;
width: 100%;
}
</style>
</head>
<body class="min-h-screen">
<!-- Hero Section -->
<section class="relative min-h-screen flex items-center justify-center p-8">
<div class="absolute inset-0 highlight-gradient"></div>
<div class="relative z-10 max-w-7xl mx-auto">
<div class="text-center">
<h1 class="hero-title text-6xl md:text-8xl lg:text-9xl text-black mb-4">
国产模型<br><span class="text-[#4D6BFE]">技术突破</span>
</h1>
<p class="eng-caption text-xl md:text-2xl text-gray-600 mt-4">
Kimi K2 Agent & Coding Capability Report
</p>
<div class="mt-12 grid grid-cols-1 md:grid-cols-3 gap-8">
<div class="metric-card p-8 tech-border">
<div class="giant-number -top-8 -left-8">01</div>
<h3 class="text-3xl font-bold text-black mb-2">代码能力</h3>
<p class="text-gray-600 eng-caption">Code Generation Quality</p>
<div class="mt-4 text-4xl font-bold text-[#4D6BFE]">A+</div>
</div>
<div class="metric-card p-8 tech-border">
<div class="giant-number -top-8 -left-8">02</div>
<h3 class="text-3xl font-bold text-black mb-2">Agent 能力</h3>
<p class="text-gray-600 eng-caption">Agent Performance</p>
<div class="mt-4 text-4xl font-bold text-[#4D6BFE]">A+</div>
</div>
<div class="metric-card p-8 tech-border">
<div class="giant-number -top-8 -left-8">03</div>
<h3 class="text-3xl font-bold text-black mb-2">综合评分</h3>
<p class="text-gray-600 eng-caption">Overall Rating</p>
<div class="mt-4 text-4xl font-bold text-[#4D6BFE]">A+</div>
</div>
</div>
</div>
</div>
</section>
<!-- Key Metrics -->
<section class="py-20 px-8">
<div class="max-w-7xl mx-auto">
<h2 class="text-5xl font-bold text-center text-black mb-16">
关键维度<span class="text-[#4D6BFE]">突破</span>
</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-12">
<!-- Code Capability -->
<div class="space-y-8">
<div>
<h3 class="text-4xl font-bold text-black mb-4">
代码能力不再是短板
</h3>
<p class="text-gray-600 eng-caption mb-6">
3D 动态山脉 & Bento Grid 一图流
</p>
</div>
<div class="space-y-4">
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">3D 动态山脉</span>
<span class="text-[#4D6BFE] font-bold">一次成型</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">Bento Grid 视觉</span>
<span class="text-[#4D6BFE] font-bold">审美在线</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">长文理解</span>
<span class="text-[#4D6BFE] font-bold">万字级</span>
</div>
</div>
<div class="chart-container">
<canvas id="codeChart"></canvas>
</div>
</div>
<!-- Agent Capability -->
<div class="space-y-8">
<div>
<h3 class="text-4xl font-bold text-black mb-4">
Agent 能力更是惊喜
</h3>
<p class="text-gray-600 eng-caption mb-6">
Chat Memo 项目真实测试
</p>
</div>
<div class="space-y-4">
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">Claude Code 外壳</span>
<span class="text-[#4D6BFE] font-bold">未适配</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">Trae + Claude</span>
<span class="text-[#4D6BFE] font-bold">多轮 Prompt</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<span class="text-lg font-bold">Kimi K2</span>
<span class="text-[#4D6BFE] font-bold">同等结果</span>
</div>
</div>
<div class="chart-container">
<canvas id="agentChart"></canvas>
</div>
</div>
</div>
</div>
</section>
<!-- Comparison Table -->
<section class="py-20 px-8 bg-gray-50">
<div class="max-w-7xl mx-auto">
<h2 class="text-5xl font-bold text-center text-black mb-16">
模型<span class="text-[#4D6BFE]">对比</span>
</h2>
<div class="overflow-x-auto">
<table class="w-full text-left">
<thead>
<tr class="border-b-2 border-black">
<th class="py-4 px-6 text-2xl font-bold">能力维度</th>
<th class="py-4 px-6 text-2xl font-bold">Kimi K2</th>
<th class="py-4 px-6 text-2xl font-bold">Claude</th>
<th class="py-4 px-6 text-2xl font-bold">Gemini</th>
</tr>
</thead>
<tbody>
<tr class="border-b">
<td class="py-6 px-6 text-xl font-bold">代码生成</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
</td>
</tr>
<tr class="border-b">
<td class="py-6 px-6 text-xl font-bold">视觉审美</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</td>
</tr>
<tr>
<td class="py-6 px-6 text-xl font-bold">Agent 能力</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
</td>
<td class="py-6 px-6">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
</td>
</tr>
</tbody>
</table>
</div>
</div>
</section>
<!-- Conclusion -->
<section class="py-20 px-8">
<div class="max-w-4xl mx-auto text-center">
<h2 class="text-5xl font-bold text-black mb-8">
打破<span class="text-[#4D6BFE]">刻板印象</span>
</h2>
<p class="text-2xl font-bold text-black leading-relaxed">
国产模型在代码生成和 Agent 能力上<br>
已经具备<span class="text-[#4D6BFE]">国际顶尖水准</span>
</p>
<p class="eng-caption text-xl text-gray-600 mt-4">
Kimi K2: Redefining Chinese AI Model Capabilities
</p>
</div>
</section>
<script>
// Code Capability Chart
const codeCtx = document.getElementById('codeChart').getContext('2d');
new Chart(codeCtx, {
type: 'radar',
data: {
labels: ['代码质量', '审美水平', '一次成型', '长文理解', '响应速度'],
datasets: [{
label: 'Kimi K2',
data: [95, 90, 98, 92, 88],
borderColor: '#4D6BFE',
backgroundColor: 'rgba(77, 107, 254, 0.1)',
pointBackgroundColor: '#4D6BFE',
pointBorderColor: '#fff',
pointHoverBackgroundColor: '#fff',
pointHoverBorderColor: '#4D6BFE'
}, {
label: 'Claude',
data: [93, 85, 90, 95, 90],
borderColor: '#000',
backgroundColor: 'rgba(0, 0, 0, 0.05)',
pointBackgroundColor: '#000',
pointBorderColor: '#fff',
pointHoverBackgroundColor: '#fff',
pointHoverBorderColor: '#000'
}]
},
options: {
responsive: true,
maintainAspectRatio: false,
plugins: {
legend: {
display: false
}
},
scales: {
r: {
beginAtZero: true,
max: 100,
ticks: {
display: false
},
grid: {
color: 'rgba(77, 107, 254, 0.2)'
},
angleLines: {
color: 'rgba(77, 107, 254, 0.2)'
}
}
}
}
});
// Agent Capability Chart
const agentCtx = document.getElementById('agentChart').getContext('2d');
new Chart(agentCtx, {
type: 'doughnut',
data: {
labels: ['单轮完成', '多轮优化', '工具调用', '状态保持', '错误恢复'],
datasets: [{
data: [35, 25, 20, 15, 5],
backgroundColor: [
'#4D6BFE',
'rgba(77, 107, 254, 0.8)',
'rgba(77, 107, 254, 0.6)',
'rgba(77, 107, 254, 0.4)',
'rgba(77, 107, 254, 0.2)'
],
borderWidth: 0
}]
},
options: {
responsive: true,
maintainAspectRatio: false,
plugins: {
legend: {
display: false
}
}
}
});
</script>
</body>
</html>## 任务
我是 AI 科技评测博主,中立客观。请阅读我的文章中的要点,帮我生成一个好看的配图(由多页ppt组成,风格与你现在生成的图一致),具体要求为:
- 尽量在一页展示全部信息,背景为白色、文字和按钮颜色为纯黑色,高亮色为#4D6BFE
- 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差
- 网页需要以响应式兼容更大的显示器宽度比如1920px及以上
- 中英文混用,中文大字体粗体,英文小字作为点缀
- 简洁的勾线图形化作为数据可视化或者配图元素
- 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变
- 数据可以引用在线的图表组件,样式需要跟主题一致
- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
- 避免使用emoji作为主要图标
- 不要省略内容要点,不要胡编乱造
## 内容
标题:Kimi 的新模型,真的好用吗?
Kimi K2 发布了 2 天,我也测了 2 天。
如果仔细观察 Kimi 这次的官方发布稿,不难发现 Kimi K2 在强调的重点:Agent 与 Coding 能力。
[图片]
这是很有意思的转变:面向 Agent 时代,把通用 Agent 能力放到了极其重要的位置。
而在实测过程中,Kimi 也确实给了我很多意外之喜。
甚至在部分任务中,比起 Claude、Gemini 毫不逊色,并大幅降低了 Agent 任务的成本。
暂时无法在飞书文档外展示此内容
如果你有段时间没关注 Kimi,或者一直不太相信国产模型的 Agent / Coding 能力。
那么,本文也许能让你的看法有所改变。(甚至还能用 Kimi 代替 Claude Code,文中附教程)
---
照例先介绍下 Kimi K2
Kimi 这次只发了 1 款模型——Kimi K2。
我把官方发布介绍,总结了为了一图流,方便你快速浏览 K2 的特点:
[图片]
关键点如下:
1. 总参数 1T,激活参数 32B 的 MoE 模型
2. 主打代码能力、通用 Agent 任务
3. 在多项 benchmark 基准测试中,获得开源模型中的 SOTA 成绩
4. 完全开源;兼容 OpenAI、Anthropic API 格式
我确实一向不太看各种 BenchMark 跑分,纸面 SOTA 不如自己动手测几个场景。
所以,我也对于主打 Coding、Agent 的 Kimi K2,进行了详尽测试,用于观察 Kimi K2 具体表现,也希望能帮你建立初步的模型预期。
---
实测 Kimi K2 表现
一个大模型,要完成一项 Agent 任务,往往需要强大的自主规划与迭代思考能力,以及调用工具做任务的能力。
而 Coding 能力正是 Agent 执行任务的基础,所以先对代码生成能力进行测试:
💻 代码生成:对比 Claude、Gemini,不落下风
AI Coding 领域,用户对模型的挑剔程度无疑是最高的。
大家只会去用最好、最强的模型。(如果没有特殊原因,放着最好的模型不用,就是给自己的 Coding 过程添堵。)
放眼整个 2025 上半年,开发者在用的 AI Coding 模型只有 1.5 个选择:
1. 绝对主力:Claude 3.7 → 4(Windsurf 被曝要被 OpenAI 收购时,有一批用户担心以后不能用 Claude,直接取消了订阅)
2. 偶尔用用的 Gemini 2.5 Pro(用来做 Coding 的方案规划不错;Gemini Cli 最近风评尚可)
所以,要验证模型的 Coding 能力如何,最直观的方式,还是直接和 Claude、Gemini 比一比。
---
1)生成 3D Html 山脉:初见 Kimi 新水平
Kimi 官方发布中,有一个测试用例表现很厉害:
[图片]
好奇又将信将疑,到底是“只有 Kimi 这么强”,还是“其实 Claude、Gemini 都能做到”?
于是第 1 个 Case,就实测了这个 3D 山脉 Html 生成任务:
创建一个 3D HTML 山脉场景,包含悬崖、河流和昼夜光照变化。支持拖动和缩放、动画过渡、真实感渐变色,并可切换等高线显示
[图片]
以下是 Kimi K2、Claude 4 sonnet、Gemini 2.5 Pro 的对比效果,均按第一次生成结果呈现:
(为了确保测试强度拉满,Claude 是默认开启了 Extended-Thinking 模式)
暂时无法在飞书文档外展示此内容
- Kimi:https://www.kimi.com/share/d1p0hqteik6gtjvsri30
- Gemini:https://g.co/gemini/share/f7570f1cbfbe
- Claude:https://claude.ai/share/b154de4a-cc25-4f8d-a963-34b8512560fd
令人惊异,Kimi 在此轮测试中,径直得到了三者中最好的效果:
- Kimi:山脉走势美观、河流覆盖真实,有昼夜系统、真实光影
- Claude:抽象的样式,丢失了河流
- Gemini:有山有水,但效果同样不行
要知道在过往模型测试中,国内模型明显比海外好,是一件非常少见的现象,这点打破了我的刻板印象。
考虑到是官方自己选的 Case,所以还是继续上强度,测一些我自己的真实场景。
[图片]
---
2)一图流总结万字长文:依然靠谱
这是一个很高频、实用的任务。也能让你的文章更加好看:
我的每个 AI 产品测试文章都会用 AI 根据文章全文,输出一图流的总结网页。基本只用 Claude、Gemini 生成。
Prompt 如下:
## 以下是我的文章:
[粘贴文章内容]
## 任务
我是 AI 科技评测博主,中立客观。请阅读我的文章中的要点,帮我用类似苹果发布会PPT的Bento Grid风格的视觉设计生成一个中文动态网页展示,具体要求为:
- 尽量在一页展示全部信息,背景为白色、文字和按钮颜色为纯黑色,高亮色为#4D6BFE
- 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差
- 网页需要以响应式兼容更大的显示器宽度比如1920px及以上
- 中英文混用,中文大字体粗体,英文小字作为点缀
- 简洁的勾线图形化作为数据可视化或者配图元素
- 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变
- 数据可以引用在线的图表组件,样式需要跟主题一致
- 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript
- 使用专业图标库如Font Awesome或Material Icons(通过CDN引入)
- 避免使用emoji作为主要图标
- 不要省略内容要点
这看上去不复杂的任务,实际上考察了两个维度:
1. 准确识别长文本(我测的文章足足有上万字内容)中的内容逻辑,提炼高优先级信息,并重组为结构化表达
2. 根据内容情况,设计合理、美观的排版布局,并用前端代码实现网页
一开始对于不支持 thinking 推理的 Kimi ,在长内容提炼上,没抱有太大的期待。
而这是 Kimi K2、Claude 4 sonnet-thinking、Gemini 2.5 Pro 的表现:
[图片]
- Kimi:https://www.kimi.com/share/d1pgj4umcu0l65fkirag
- Gemini:https://g.co/gemini/share/a71ade78c832
- Claude:https://claude.ai/share/8e1c8641-97cd-4123-baab-9d8f3f1b6b2b
在整个过程中,除了 Gemini 一次性取得了较好的结果以外。
Kimi 也一次性生成成功,初版稍微少了些细节,让它增加一些内容细节,也顺利取得了第 2 个更详细的版本:
——内容完全正确、表达更详尽、排版更合理。(我猜是因为没有 thinking 模式,在生成过程中对于内容的取舍,Kimi 会略微吃亏)
反而是 Claude 4 sonnet-thinking,频频报错,经过 Debug 3 次才取得了完整网页,在布局、样式选用上也不太合理。
[图片]
所以我当时还在即刻上发了一个帖子,表示意外:Kimi K2 已经连续在我测的两个任务里,表现的都比 Claude 4 sonnet-thinking 好了。
甚至不太敢下这个反“刻板印象”的结论。
[图片]
这么整体测下来,其实也能初步看出:
Kimi K2 有审美了,代码生成任务也挺稳定。
模型本身进步很明显,真的拉近了与国际 TOP 模型的差距,没准可以在日常 Coding 任务中作为不错的模型选择。
---
🤖 Agent 能力测试:在实战里,也能真干活了
但 Kimi K2 在单一文件的代码生成上表现惊艳,是否就能意味着它能胜任更复杂的 Agent 任务?
如 Claude Code、Cursor 等 Coding Agent,无不要求 Agentic 模型自主规划任务方案、理解项目 context、调用各类 tools 完成 Coding。
换句话说,Coding Agent 场景,即是当下最适合考验 Agentic 模型能力的基准场景。
我刚好有个自己在做的产品:Chat Memo,拿来给 Kimi 好好上上强度 😈
于是,用 Kimi K2「夺舍」Claude Code(以下代称为 Kimi-code),来执行一次真实需要开发迭代的任务:从 0 理解 Chat Memo 项目,分析完整代码架构,并找到记忆列表卡片的功能与交互逻辑,按指定要求迭代。
(刚好我本周用 Trae + Claude 开发过这个任务,也正好用来比较双方差距)
先输入简单的需求提示:
[图片]
如图,Claude Code 的 API Url 是 Kimi 的 API 地址,已经是 CC 的壳,Kimi 的心了。
在 Prompt 发送后,可以看到,Kimi 在收到用户要求后,开始规划任务计划。
然后自主使用 Claude Code 内封装的工具,对完整的项目内容进行查找、分析,并对代码进行修改编写:
[图片]
[图片]
……Kimi,你为什么用 Claude 的工具这么熟练啊?总感觉有种 Claude 被 Kimi NTR 的感觉
整个过程很顺利,经过几分钟的 Coding 过程,“Kimi Code”就一次性执行完毕,输出如下:
[图片]
为了方便对比最终的 Agent 任务效果,我先展示下迭代之前的原版:
[图片]
而这是经过 Kimi-Code 自主一次性迭代后的版本:
暂时无法在飞书文档外展示此内容
另外,这是之前 Trae + Claude 4 sonnet 多轮提示后,开发的版本:
暂时无法在飞书文档外展示此内容
甚至我更喜欢 Kimi 的效果细节(hover 的交互样式更加合理,不知道你是否能看出来区别)。
而这项 Agent 任务的费用,我在 Kimi 开放平台看了下 API 用量,只要 5 毛钱。
Btw:值得注意的是,Claude Code 中的所有 Prompt、工具,都是为了 Claude AI 自身所开发封装的。
而 Kimi 作为一个外来 Agent 模型,能在未经适配的环境下,体现出了极强的泛化与适应能力,顺利完成任务,展现了一流的 Agentic 智力。
——说句“Kimi 通过自主使用 CC,实现了 Trae + Claude 4 sonnet 同样的 Coding 实战效果”,并不过分。
[图片]
如对 Kimi K2 夺舍 Claude Code 的方法感兴趣,下文也提供了详细的教程指引。
小结:Kimi K2 通过 Claude Code ,能稳定完成实际项目的 Coding Agent 任务。值得推荐读者针对自身情况,进一步测试体验。
---
🗂️ 更多测试:整体顺利,点赞
另外,我也继续用 Kimi Code 测试了很多其他的 Agent 任务,但受限于篇幅,不再一一列举过程。
直接呈现一些关键结果:
1)从 0 到 1,开发一款生死时速 Html 游戏
[图片]
Kimi 的任务规划:
[图片]
一次性开发效果如下:
暂时无法在飞书文档外展示此内容
正如上文所言,毕竟 Kimi 用的是 Claude Code 的工具,很多 Prompt、参数的封装和 K2 其实并未适配。
在后续迭代测试时,偶尔会出现Invalid tool parameters的报错,导致任务进程中断,可以理解。也期待 Kimi 下次发布真正的 Kimi Code,充分发挥 K2 的 Agent 能力。
---
2)批处理本地文件,整合数据为表格
要求 Kimi 自行阅读 48 份 txt 文档,将每篇文档的元信息统一提取制表:
[图片]
[图片]
整体也很顺利:
[图片]
Kimi 生成的 Markdown 文件内容如下:
[图片]
数据内容没有任何问题。
Kimi 在读取本地内容,进行数据处理的任务,同样通过了基础测试。
---
📎 附:如何用 Kimi K2 使用 Claude Code?
鉴于现在是 2025 年,我们可以用 AI+ 的安装方法——让 Kimi K2 全程指导你安装:
1)安装 Claude Code(如果未装)
1)打开 Kimi Chat,发送以下消息
参考以下网页,一步步指导我在 Mac 终端中安装该程序:
[完整粘贴 Claude Code 官方设置文档:https://docs.anthropic.com/zh-CN/docs/claude-code/setup ]
如:
[图片]
Kimi 会回应你一份比官方文档清晰、易读很多的指导方案:
[图片]
跟着照做就好。
2)如遇安装问题,不知如何处理?
也很简单。
比如这是出问题的最后一次命令记录 ⬇️
[图片]
按如下方式粘贴发送给 Kimi:
[图片]
我在这一步出现问题了,终端记录为:
[粘贴终端中最后一次命令记录]
即可得到下一步回应:
[图片]
3)替换 Claude Code 为 Kimi Code,即可运行!
当安装完成、运行claude之前,我建议你把终端切到一个测试文件夹中(用于控制读写范围,CC 只能访问该路径下的内容)
[图片]
cd [路径名称]
成功后,会显示出路径变化:
[图片]
然后需要替换 Kimi 的 API,输入以下内容即可:
export ANTHROPIC_AUTH_TOKEN=[替换为你的 Moonshot API Key]
export ANTHROPIC_BASE_URL=https://api.moonshot.cn/anthropic
1. 如无 Moonshot API Key ,需前往 https://platform.moonshot.cn/console/api-keys 创建并获取(没余额的话,先到「账户充值」充一点就好)
2. 注意!如果你是在 moonshot.ai(海外站)生成的,则要把 ANTHROPIC_BASE_URL 替换为https://api.moonshot.ai/anthropic ,不然就无法顺利运行
再运行claude,一切顺利即可看到 welcome 提示:
[图片]
然后就可以直接输入自然语言,开始让 Kimi 替你试着干点活了。
---
不止如此:远比 Claude 便宜的价格,以及彻底的开源
还记得上面 Chat Memo 的迭代任务,只花了 0.5 元的 token 费用吗?
其实包含后文的全部测试,全部跑下来也只花了不到 1 美金。
是的,Kimi K2 这个 1T 总参数、32B 激活参数的 MoE 模型,不仅在能力上让人惊喜,在价格和开放性上也有着相当的诚意。
[图片]
相比 Claude Sonnet 4 的 3 美金/百万 tokens,Kimi K2 只需要其 20% 的价格,即可换来接近的 Coding 表现:
- 每百万输入 tokens:4 元
- 每百万输出 tokens:16 元
也兼容 OpenAI 和 Anthropic 的 API 格式,可以无缝集成到现有的 Agent 程序里,大幅降低了开发者的迁移成本。
所以,除了普通用户可以在 https://www.kimi.com/ 中可以直接体验 K2 外,AI 应用公司们也能通过 API 低成本用 Kimi K2 来构造一些本土 Agent、Coding 应用了。
另外,月之暗面也在同一时间开源了 Kimi K2 的两个版本:
- Kimi-K2-Base:未经过指令微调的基础预训练模型,适合需要进行深度自定义和学术研究的场景。
- Kimi-K2-Instruct:通用指令微调版本,在 Coding / Agent 任务中表现优异,开箱即用。
官方已将模型与权重文件开源至 Hugging Face:https://huggingface.co/moonshotai/Kimi-K2-Instruct
---
🎐 写在最后:Kimi K2,不止于“纸面 SOTA”
横向对比也好、真实场景实测也罢,我觉得可以下一个明确的结论了:
Kimi K2 并非只是在跑分上好看的模型。
在这两天贴近真实环境的测试中,Kimi 切实展现出了接近国际顶尖模型的 Agent / Coding 能力。
它的进步在两个关键维度上肉眼可见:
1. 代码能力不再是短板:无论是一次成型的 3D 动态山脉,还是准确理解上万字长文并生成 Bento Grid 风格一图流,Kimi K2 的代码生成质量和审美,都完全不输 Claude 和 Gemini。这直接打破了我对国产模型“不擅代码、审美一般”的刻板印象。
2. Agent 能力更是惊喜:在「Chat Memo」项目的真实迭代需求测试中,Kimi K2 仅凭 Claude Code 这个未经适配的 Agent 外壳,达到了需要 Trae + Claude 多轮 Prompt 才取得的同等开发结果。
[图片]
它能从零开始自主理解项目架构、自主规划任务、并调用(非原生的)工具完成开发。
仅凭一个未经适配的 Claude Code ,就能出色完成任务,已经证明了 Kimi K2 作为 一个 Agentic 模型的核心能力:一流的智力与出色的泛化能力。
(2025 年下半年,凭借越来越好用的国产开源 Agentic 模型,垂直 Agent 赛道无疑将真正卷出天际)
---
另外,我也让 Kimi K2,自行阅读了本文,让 Kimi 按照它的理解生成了全文一图流总结,样式真的非常好看:
[图片]
Case 地址:https://www.kimi.com/share/d1praevaa0vadk8tesm0
大模型发展到 2025 年中这个阶段,仅靠简单的 Chat 问答测试,已经很难去评判模型水平的高低。
未来模型能力的较量,将发生在各个真实的项目里,发生在每一次 Context 理解、自主规划、工具调用、任务执行中。
届时,衡量是否选用一个模型的标准,将是一个更朴素、也更严苛的复合指标:综合可用性。它包含了三个核心维度:
- 质量: 在我的目标任务上,它能做到什么程度?
- 效率: 它完成任务的速度有多快、多稳定?
- 成本: 完成这个结果,需要多少费用?
谁能让 AI 变得更好用、靠谱、便宜,谁就能在下一阶段的 AI Agent 应用浪潮中,赢得更广泛的开发者与用户。
而这一轮,Kimi K2 准备得相当不错。
HTML
Preview
Copy
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Kimi K2 深度测评 | 多页PPT报告</title>
<script src="https://cdn.tailwindcss.com"></script>
<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.5.1/css/all.min.css">
<script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
<style>
@import url('https://fonts.googleapis.com/css2?family=Inter:wght@300;400;500;600&display=swap');
:root {
--highlight: #4D6BFE;
--text-primary: #000000;
--bg-primary: #ffffff;
}
body {
font-family: 'Inter', -apple-system, BlinkMacSystemFont, sans-serif;
background: var(--bg-primary);
color: var(--text-primary);
overflow-x: hidden;
}
.slide {
min-height: 100vh;
display: none;
align-items: center;
justify-content: center;
padding: 4rem;
}
.slide.active {
display: flex;
}
.giant-title {
font-size: clamp(4rem, 8vw, 12rem);
font-weight: 900;
line-height: 0.9;
letter-spacing: -0.02em;
}
.section-title {
font-size: clamp(2.5rem, 5vw, 6rem);
font-weight: 900;
line-height: 1;
}
.data-viz {
position: relative;
overflow: hidden;
}
.data-viz::before {
content: '';
position: absolute;
inset: 0;
background: linear-gradient(135deg, rgba(77, 107, 254, 0.05) 0%, transparent 50%);
pointer-events: none;
}
.metric-card {
border: 2px solid var(--highlight);
position: relative;
transition: transform 0.3s ease;
}
.metric-card:hover {
transform: translateY(-4px);
}
.metric-card::after {
content: '';
position: absolute;
inset: -1px;
border: 1px solid var(--highlight);
opacity: 0.3;
animation: pulse 2s infinite;
}
@keyframes pulse {
0%, 100% { opacity: 0.3; transform: scale(1); }
50% { opacity: 0.1; transform: scale(1.02); }
}
.nav-dots {
position: fixed;
right: 2rem;
top: 50%;
transform: translateY(-50%);
z-index: 1000;
}
.nav-dot {
width: 12px;
height: 12px;
border-radius: 50%;
background: rgba(0, 0, 0, 0.2);
margin: 0.5rem 0;
cursor: pointer;
transition: all 0.3s ease;
}
.nav-dot.active {
background: var(--highlight);
transform: scale(1.5);
}
.progress-bar {
position: fixed;
top: 0;
left: 0;
height: 2px;
background: var(--highlight);
transition: width 0.3s ease;
z-index: 1000;
}
</style>
</head>
<body>
<!-- Progress Bar -->
<div class="progress-bar" id="progressBar"></div>
<!-- Navigation Dots -->
<div class="nav-dots">
<div class="nav-dot active" onclick="goToSlide(0)"></div>
<div class="nav-dot" onclick="goToSlide(1)"></div>
<div class="nav-dot" onclick="goToSlide(2)"></div>
<div class="nav-dot" onclick="goToSlide(3)"></div>
<div class="nav-dot" onclick="goToSlide(4)"></div>
</div>
<!-- Slide 1: Title -->
<div class="slide active">
<div class="max-w-7xl mx-auto text-center">
<h1 class="giant-title mb-4">Kimi K2</h1>
<h2 class="text-4xl font-light mb-8">真的好用吗?</h2>
<div class="grid grid-cols-1 md:grid-cols-3 gap-8 mt-16">
<div class="metric-card p-8">
<div class="text-5xl font-bold text-[#4D6BFE] mb-2">2天</div>
<div class="text-sm uppercase tracking-wider">实测周期</div>
</div>
<div class="metric-card p-8">
<div class="text-5xl font-bold text-[#4D6BFE] mb-2">100%</div>
<div class="text-sm uppercase tracking-wider">开源</div>
</div>
<div class="metric-card p-8">
<div class="text-5xl font-bold text-[#4D6BFE] mb-2">20%</div>
<div class="text-sm uppercase tracking-wider">成本对比</div>
</div>
</div>
</div>
</div>
<!-- Slide 2: Core Specs -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-16 text-center">核心规格</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-16 items-center">
<div class="space-y-8">
<div class="flex items-baseline space-x-4">
<span class="text-8xl font-black text-[#4D6BFE]">1T</span>
<span class="text-2xl font-medium">总参数</span>
<span class="text-sm text-gray-600">MoE架构</span>
</div>
<div class="flex items-baseline space-x-4">
<span class="text-8xl font-black text-[#4D6BFE]">32B</span>
<span class="text-2xl font-medium">激活参数</span>
<span class="text-sm text-gray-600">推理高效</span>
</div>
</div>
<div class="space-y-6">
<div class="flex items-center space-x-4">
<i class="fas fa-code text-2xl text-[#4D6BFE]"></i>
<span class="text-xl font-semibold">主打代码能力</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-robot text-2xl text-[#4D6BFE]"></i>
<span class="text-xl font-semibold">通用Agent任务</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-trophy text-2xl text-[#4D6BFE]"></i>
<span class="text-xl font-semibold">开源模型SOTA</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-plug text-2xl text-[#4D6BFE]"></i>
<span class="text-xl font-semibold">兼容OpenAI/Anthropic API</span>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 3: Code Test Results -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-16 text-center">代码实测对比</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-16">
<div class="data-viz">
<h3 class="text-3xl font-bold mb-8">3D山脉生成</h3>
<div class="space-y-6">
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<div>
<span class="text-2xl font-bold block">Kimi K2</span>
<span class="text-sm text-gray-600">一次成型,效果最佳</span>
</div>
<span class="text-4xl font-black text-[#4D6BFE]">A+</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-gray-300">
<div>
<span class="text-2xl font-bold block">Claude 4</span>
<span class="text-sm text-gray-600">抽象样式,丢失河流</span>
</div>
<span class="text-4xl font-black text-gray-400">B</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-gray-300">
<div>
<span class="text-2xl font-bold block">Gemini 2.5</span>
<span class="text-sm text-gray-600">效果一般,有山有水</span>
</div>
<span class="text-4xl font-black text-gray-400">B+</span>
</div>
</div>
</div>
<div class="data-viz">
<h3 class="text-3xl font-bold mb-8">长文总结</h3>
<div class="space-y-6">
<div class="flex items-center justify-between p-4 border-l-4 border-[#4D6BFE]">
<div>
<span class="text-2xl font-bold block">Kimi K2</span>
<span class="text-sm text-gray-600">一次成功,细节完整</span>
</div>
<span class="text-4xl font-black text-[#4D6BFE]">A</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-gray-300">
<div>
<span class="text-2xl font-bold block">Claude 4</span>
<span class="text-sm text-gray-600">多次调试才成功</span>
</div>
<span class="text-4xl font-black text-gray-400">C+</span>
</div>
<div class="flex items-center justify-between p-4 border-l-4 border-gray-300">
<div>
<span class="text-2xl font-bold block">Gemini 2.5</span>
<span class="text-sm text-gray-600">一次性成功</span>
</div>
<span class="text-4xl font-black text-gray-400">A-</span>
</div>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 4: Agent Test -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-16 text-center">Agent实战测试</h2>
<div class="grid grid-cols-1 lg:grid-cols-3 gap-8">
<div class="metric-card p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">0.5元</div>
<div class="text-lg font-medium mb-2">Chat Memo迭代成本</div>
<div class="text-sm text-gray-600">vs Trae+Claude多轮提示</div>
</div>
<div class="metric-card p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">100%</div>
<div class="text-lg font-medium mb-2">任务成功率</div>
<div class="text-sm text-gray-600">自主规划+工具调用</div>
</div>
<div class="metric-card p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">5min</div>
<div class="text-lg font-medium mb-2">完整开发时长</div>
<div class="text-sm text-gray-600">从0到1理解项目</div>
</div>
</div>
<div class="mt-16 text-center">
<div class="inline-block p-8 border-2 border-[#4D6BFE]">
<h3 class="text-3xl font-bold mb-4">核心突破</h3>
<p class="text-xl">未经适配的Claude Code外壳<br>达到原生Claude同等效果</p>
</div>
</div>
</div>
</div>
<!-- Slide 5: Final Verdict -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-16 text-center">最终结论</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-16 items-center">
<div>
<div class="space-y-8">
<div class="flex items-start space-x-4">
<div class="text-6xl font-black text-[#4D6BFE]">1</div>
<div>
<h3 class="text-2xl font-bold mb-2">代码能力不再是短板</h3>
<p class="text-gray-600">3D动态山脉、Bento Grid长文总结,质量不输Claude/Gemini</p>
</div>
</div>
<div class="flex items-start space-x-4">
<div class="text-6xl font-black text-[#4D6BFE]">2</div>
<div>
<h3 class="text-2xl font-bold mb-2">Agent能力真正可用</h3>
<p class="text-gray-600">自主规划+工具调用,完成真实项目迭代</p>
</div>
</div>
<div class="flex items-start space-x-4">
<div class="text-6xl font-black text-[#4D6BFE]">3</div>
<div>
<h3 class="text-2xl font-bold mb-2">成本优势显著</h3>
<p class="text-gray-600">仅为Claude价格的20%,完全开源</p>
</div>
</div>
</div>
</div>
<div class="text-center">
<div class="text-8xl font-black text-[#4D6BFE] mb-4">A+</div>
<div class="text-3xl font-bold mb-4">综合评级</div>
<div class="text-xl text-gray-600">打破刻板印象的国产力作</div>
</div>
</div>
</div>
</div>
<script>
let currentSlide = 0;
const slides = document.querySelectorAll('.slide');
const totalSlides = slides.length;
function updateSlide() {
slides.forEach(slide => slide.classList.remove('active'));
slides[currentSlide].classList.add('active');
document.querySelectorAll('.nav-dot').forEach((dot, index) => {
dot.classList.toggle('active', index === currentSlide);
});
const progress = ((currentSlide + 1) / totalSlides) * 100;
document.getElementById('progressBar').style.width = `${progress}%`;
}
function goToSlide(slideIndex) {
if (slideIndex >= 0 && slideIndex < totalSlides) {
currentSlide = slideIndex;
updateSlide();
}
}
document.addEventListener('keydown', (e) => {
if (e.key === 'ArrowLeft') goToSlide(currentSlide - 1);
if (e.key === 'ArrowRight') goToSlide(currentSlide + 1);
});
// Initialize
updateSlide();
</script>
</body>
</html>可以再增加一些细节,比如结论什么的吗?
HTML
Preview
Copy
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Kimi K2 深度测评 | 完整结论版</title>
<script src="https://cdn.tailwindcss.com"></script>
<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.5.1/css/all.min.css">
<script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
<style>
@import url('https://fonts.googleapis.com/css2?family=Inter:wght@300;400;500;600;700;900&display=swap');
:root {
--highlight: #4D6BFE;
--text-primary: #000000;
--bg-primary: #ffffff;
--bg-light: #f8f9fa;
}
body {
font-family: 'Inter', -apple-system, BlinkMacSystemFont, sans-serif;
background: var(--bg-primary);
color: var(--text-primary);
overflow-x: hidden;
}
.slide {
min-height: 100vh;
display: none;
align-items: center;
justify-content: center;
padding: 4rem;
position: relative;
}
.slide.active {
display: flex;
}
.giant-title {
font-size: clamp(4rem, 8vw, 12rem);
font-weight: 900;
line-height: 0.9;
letter-spacing: -0.02em;
}
.section-title {
font-size: clamp(2.5rem, 5vw, 6rem);
font-weight: 900;
line-height: 1;
}
.nav-dots {
position: fixed;
right: 2rem;
top: 50%;
transform: translateY(-50%);
z-index: 1000;
}
.nav-dot {
width: 12px;
height: 12px;
border-radius: 50%;
background: rgba(0, 0, 0, 0.2);
margin: 0.5rem 0;
cursor: pointer;
transition: all 0.3s ease;
border: 2px solid transparent;
}
.nav-dot.active {
background: var(--highlight);
transform: scale(1.5);
border-color: var(--bg-primary);
}
.progress-bar {
position: fixed;
top: 0;
left: 0;
height: 3px;
background: var(--highlight);
transition: width 0.3s ease;
z-index: 1000;
box-shadow: 0 0 10px rgba(77, 107, 254, 0.5);
}
.metric-card {
border: 2px solid var(--highlight);
position: relative;
transition: all 0.3s ease;
background: var(--bg-primary);
}
.metric-card:hover {
transform: translateY(-4px);
box-shadow: 0 8px 32px rgba(77, 107, 254, 0.15);
}
.metric-card::after {
content: '';
position: absolute;
inset: -1px;
border: 1px solid var(--highlight);
opacity: 0.3;
animation: pulse 2s infinite;
}
@keyframes pulse {
0%, 100% { opacity: 0.3; transform: scale(1); }
50% { opacity: 0.1; transform: scale(1.02); }
}
.highlight-text {
color: var(--highlight);
position: relative;
}
.highlight-text::after {
content: '';
position: absolute;
bottom: -2px;
left: 0;
right: 0;
height: 3px;
background: var(--highlight);
transform: scaleX(0);
transform-origin: left;
animation: underline 0.6s ease forwards;
}
@keyframes underline {
to { transform: scaleX(1); }
}
.chart-container {
position: relative;
height: 300px;
width: 100%;
}
.conclusion-box {
background: linear-gradient(135deg, rgba(77, 107, 254, 0.05) 0%, rgba(77, 107, 254, 0.02) 100%);
border: 1px solid rgba(77, 107, 254, 0.2);
}
.testimonial {
border-left: 4px solid var(--highlight);
padding-left: 2rem;
font-style: italic;
}
.key-insight {
position: relative;
padding: 2rem;
margin: 2rem 0;
background: linear-gradient(135deg, rgba(77, 107, 254, 0.1) 0%, rgba(77, 107, 254, 0.05) 100%);
border-radius: 8px;
}
.key-insight::before {
content: '💡';
position: absolute;
top: -1rem;
left: 2rem;
font-size: 2rem;
background: var(--bg-primary);
padding: 0 0.5rem;
}
</style>
</head>
<body>
<!-- Progress Bar -->
<div class="progress-bar" id="progressBar"></div>
<!-- Navigation Dots -->
<div class="nav-dots">
<div class="nav-dot active" onclick="goToSlide(0)"></div>
<div class="nav-dot" onclick="goToSlide(1)"></div>
<div class="nav-dot" onclick="goToSlide(2)"></div>
<div class="nav-dot" onclick="goToSlide(3)"></div>
<div class="nav-dot" onclick="goToSlide(4)"></div>
<div class="nav-dot" onclick="goToSlide(5)"></div>
<div class="nav-dot" onclick="goToSlide(6)"></div>
</div>
<!-- Slide 1: Title with Context -->
<div class="slide active">
<div class="max-w-7xl mx-auto text-center">
<h1 class="giant-title mb-4">Kimi K2</h1>
<h2 class="text-4xl font-light mb-8">真的好用吗?</h2>
<div class="text-xl text-gray-600 mb-12">
2天深度实测 · 打破国产模型刻板印象
</div>
<div class="grid grid-cols-1 md:grid-cols-4 gap-6 mt-16">
<div class="metric-card p-6">
<div class="text-4xl font-bold text-[#4D6BFE] mb-2">1T</div>
<div class="text-sm uppercase tracking-wider">总参数</div>
</div>
<div class="metric-card p-6">
<div class="text-4xl font-bold text-[#4D6BFE] mb-2">32B</div>
<div class="text-sm uppercase tracking-wider">激活参数</div>
</div>
<div class="metric-card p-6">
<div class="text-4xl font-bold text-[#4D6BFE] mb-2">100%</div>
<div class="text-sm uppercase tracking-wider">开源</div>
</div>
<div class="metric-card p-6">
<div class="text-4xl font-bold text-[#4D6BFE] mb-2">80%</div>
<div class="text-sm uppercase tracking-wider">成本节省</div>
</div>
</div>
</div>
</div>
<!-- Slide 2: Test Framework -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-12 text-center">测试框架</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-16">
<div>
<h3 class="text-3xl font-bold mb-6">测试维度</h3>
<div class="space-y-4">
<div class="flex items-center space-x-4 p-4 border-l-4 border-[#4D6BFE]">
<i class="fas fa-code text-2xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">代码生成能力</div>
<div class="text-sm text-gray-600">3D渲染、长文可视化</div>
</div>
</div>
<div class="flex items-center space-x-4 p-4 border-l-4 border-[#4D6BFE]">
<i class="fas fa-robot text-2xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">Agent实战能力</div>
<div class="text-sm text-gray-600">项目迭代、工具调用</div>
</div>
</div>
<div class="flex items-center space-x-4 p-4 border-l-4 border-[#4D6BFE]">
<i class="fas fa-dollar-sign text-2xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">成本效益</div>
<div class="text-sm text-gray-600">API调用、开源价值</div>
</div>
</div>
</div>
</div>
<div>
<h3 class="text-3xl font-bold mb-6">对比基准</h3>
<div class="space-y-4">
<div class="flex items-center justify-between p-4 bg-gray-50 rounded">
<span class="font-bold">Claude 4 Sonnet</span>
<span class="text-sm text-gray-600">当前开发者首选</span>
</div>
<div class="flex items-center justify-between p-4 bg-gray-50 rounded">
<span class="font-bold">Gemini 2.5 Pro</span>
<span class="text-sm text-gray-600">方案规划优秀</span>
</div>
<div class="flex items-center justify-between p-4 bg-gray-50 rounded">
<span class="font-bold">Kimi K2</span>
<span class="text-sm text-gray-600">本次测评对象</span>
</div>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 3: Code Test Results with Details -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-12 text-center">代码实测结果</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-12">
<div class="conclusion-box p-8">
<h3 class="text-2xl font-bold mb-4">3D山脉生成任务</h3>
<div class="space-y-4">
<div class="flex justify-between items-center">
<span>Kimi K2</span>
<div class="flex space-x-1">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
</div>
</div>
<div class="flex justify-between items-center">
<span>Claude 4</span>
<div class="flex space-x-1">
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
</div>
</div>
<div class="flex justify-between items-center">
<span>Gemini 2.5</span>
<div class="flex space-x-1">
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
</div>
</div>
</div>
<div class="mt-4 text-sm text-gray-600">
评价维度:山脉美观度、河流真实性、光影效果、一次成型率
</div>
</div>
<div class="conclusion-box p-8">
<h3 class="text-2xl font-bold mb-4">长文总结任务</h3>
<div class="space-y-4">
<div class="flex justify-between items-center">
<span>Kimi K2</span>
<div class="flex space-x-1">
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="fas fa-star text-[#4D6BFE]"></i>
<i class="far fa-star text-[#4D6BFE]"></i>
</div>
</div>
<div class="flex justify-between items-center">
<span>Claude 4</span>
<div class="flex space-x-1">
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
</div>
</div>
<div class="flex justify-between items-center">
<span>Gemini 2.5</span>
<div class="flex space-x-1">
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="fas fa-star text-gray-400"></i>
<i class="far fa-star text-gray-400"></i>
</div>
</div>
</div>
<div class="mt-4 text-sm text-gray-600">
评价维度:内容准确性、视觉美观度、响应稳定性
</div>
</div>
</div>
<div class="key-insight mt-8">
<p class="text-lg font-medium">关键发现:Kimi K2 在代码审美上实现突破,打破了"国产模型不擅代码"的刻板印象</p>
</div>
</div>
</div>
<!-- Slide 4: Agent Test with Real Case -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-12 text-center">Agent实战:Chat Memo项目</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-12">
<div>
<h3 class="text-2xl font-bold mb-6">任务详情</h3>
<div class="space-y-4">
<div class="p-4 border-l-4 border-[#4D6BFE]">
<div class="font-bold">从0理解项目架构</div>
<div class="text-sm text-gray-600">自主分析完整代码结构</div>
</div>
<div class="p-4 border-l-4 border-[#4D6BFE]">
<div class="font-bold">定位功能逻辑</div>
<div class="text-sm text-gray-600">记忆列表卡片功能</div>
</div>
<div class="p-4 border-l-4 border-[#4D6BFE]">
<div class="font-bold">按需求迭代</div>
<div class="text-sm text-gray-600">交互样式优化</div>
</div>
</div>
</div>
<div>
<h3 class="text-2xl font-bold mb-6">对比结果</h3>
<div class="space-y-4">
<div class="conclusion-box p-6">
<div class="flex justify-between items-center">
<span class="font-bold">Kimi + Claude Code</span>
<span class="text-2xl font-bold text-[#4D6BFE]">0.5元</span>
</div>
<div class="text-sm text-gray-600 mt-2">一次性完成,无需调试</div>
</div>
<div class="conclusion-box p-6">
<div class="flex justify-between items-center">
<span class="font-bold">Trae + Claude 4</span>
<span class="text-2xl font-bold text-gray-400">~3元</span>
</div>
<div class="text-sm text-gray-600 mt-2">多轮提示,多次调试</div>
</div>
</div>
<div class="key-insight mt-6">
<p class="text-lg font-medium">Kimi展现出优秀的泛化能力:能熟练操作未适配的Claude工具</p>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 5: Cost Analysis -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-12 text-center">成本效益分析</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-12">
<div>
<h3 class="text-2xl font-bold mb-6">价格对比(每百万tokens)</h3>
<div class="space-y-4">
<div class="flex justify-between items-center p-4 border-b">
<span class="font-bold">Claude 4 Sonnet</span>
<span class="text-2xl font-bold">$3.0</span>
</div>
<div class="flex justify-between items-center p-4 border-b-2 border-[#4D6BFE]">
<span class="font-bold">Kimi K2</span>
<span class="text-2xl font-bold text-[#4D6BFE]">$0.6</span>
</div>
</div>
<div class="mt-6 p-4 bg-[#4D6BFE]/10 rounded">
<div class="text-center">
<div class="text-3xl font-bold text-[#4D6BFE]">节省80%</div>
<div class="text-sm text-gray-600">对于高频使用场景,成本优势显著</div>
</div>
</div>
</div>
<div>
<h3 class="text-2xl font-bold mb-6">额外价值</h3>
<div class="space-y-4">
<div class="flex items-center space-x-4">
<i class="fas fa-unlock text-xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">完全开源</div>
<div class="text-sm text-gray-600">可自由部署和定制</div>
</div>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-plug text-xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">API兼容</div>
<div class="text-sm text-gray-600">OpenAI/Anthropic格式</div>
</div>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-globe text-xl text-[#4D6BFE]"></i>
<div>
<div class="font-bold">国内部署</div>
<div class="text-sm text-gray-600">延迟更低,合规更好</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 6: Detailed Conclusion -->
<div class="slide">
<div class="max-w-7xl mx-auto w-full">
<h2 class="section-title mb-12 text-center">详细结论</h2>
<div class="grid grid-cols-1 lg:grid-cols-3 gap-8">
<div class="conclusion-box p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">1</div>
<h3 class="text-2xl font-bold mb-4">代码能力</h3>
<ul class="space-y-2 text-sm">
<li>• 3D渲染质量达到国际水准</li>
<li>• 视觉审美显著改善</li>
<li>• 一次成型率高,减少调试成本</li>
<li>• 长文本处理能力优秀</li>
</ul>
<div class="mt-4 p-3 bg-[#4D6BFE]/10 rounded text-center">
<span class="font-bold text-[#4D6BFE]">评级:A+</span>
</div>
</div>
<div class="conclusion-box p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">2</div>
<h3 class="text-2xl font-bold mb-4">Agent能力</h3>
<ul class="space-y-2 text-sm">
<li>• 自主规划能力突出</li>
<li>• 工具调用泛化性强</li>
<li>• 项目理解准确度高</li>
<li>• 任务完成率接近100%</li>
</ul>
<div class="mt-4 p-3 bg-[#4D6BFE]/10 rounded text-center">
<span class="font-bold text-[#4D6BFE]">评级:A</span>
</div>
</div>
<div class="conclusion-box p-8">
<div class="text-6xl font-black text-[#4D6BFE] mb-4">3</div>
<h3 class="text-2xl font-bold mb-4">商业价值</h3>
<ul class="space-y-2 text-sm">
<li>• 成本仅为竞品20%</li>
<li>• 完全开源,无锁定风险</li>
<li>• 国内部署,合规优势</li>
<li>• API兼容,迁移成本低</li>
</ul>
<div class="mt-4 p-3 bg-[#4D6BFE]/10 rounded text-center">
<span class="font-bold text-[#4D6BFE]">评级:A+</span>
</div>
</div>
</div>
</div>
</div>
<!-- Slide 7: Final Takeaway -->
<div class="slide">
<div class="max-w-7xl mx-auto text-center">
<h2 class="section-title mb-12">最终建议</h2>
<div class="grid grid-cols-1 lg:grid-cols-2 gap-12 mb-12">
<div class="text-left">
<h3 class="text-3xl font-bold mb-6">推荐使用场景</h3>
<div class="space-y-4">
<div class="flex items-center space-x-4">
<i class="fas fa-check-circle text-[#4D6BFE] text-xl"></i>
<span>日常Coding辅助</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-check-circle text-[#4D6BFE] text-xl"></i>
<span>Agent应用开发</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-check-circle text-[#4D6BFE] text-xl"></i>
<span>原型快速验证</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-check-circle text-[#4D6BFE] text-xl"></i>
<span>教育科研用途</span>
</div>
</div>
</div>
<div class="text-left">
<h3 class="text-3xl font-bold mb-6">注意事项</h3>
<div class="space-y-4">
<div class="flex items-center space-x-4">
<i class="fas fa-exclamation-triangle text-yellow-500 text-xl"></i>
<span>复杂项目需人工review</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-exclamation-triangle text-yellow-500 text-xl"></i>
<span>安全敏感场景谨慎使用</span>
</div>
<div class="flex items-center space-x-4">
<i class="fas fa-exclamation-triangle text-yellow-500 text-xl"></i>
<span>建议配合Claude Code使用</span>
</div>
</div>
</div>
</div>
<div class="conclusion-box p-8 text-center">
<h3 class="text-3xl font-bold mb-4">一句话总结</h3>
<p class="text-2xl leading-relaxed">
Kimi K2 是<span class="highlight-text">2025年最值得关注的国产开源模型</span>,
<br>在代码和Agent能力上已具备国际竞争力,且成本优势明显。
</p>
</div>
<div class="mt-8 text-gray-600">
<p>立即体验:kimi.com | 开发者平台:platform.moonshot.cn</p>
</div>
</div>
</div>
<script>
let currentSlide = 0;
const slides = document.querySelectorAll('.slide');
const totalSlides = slides.length;
function updateSlide() {
slides.forEach(slide => slide.classList.remove('active'));
slides[currentSlide].classList.add('active');
document.querySelectorAll('.nav-dot').forEach((dot, index) => {
dot.classList.toggle('active', index === currentSlide);
});
const progress = ((currentSlide + 1) / totalSlides) * 100;
document.getElementById('progressBar').style.width = `${progress}%`;
}
function goToSlide(slideIndex) {
if (slideIndex >= 0 && slideIndex < totalSlides) {
currentSlide = slideIndex;
updateSlide();
}
}
document.addEventListener('keydown', (e) => {
if (e.key === 'ArrowLeft') goToSlide(currentSlide - 1);
if (e.key === 'ArrowRight') goToSlide(currentSlide + 1);
});
// Initialize
updateSlide();
// Auto-advance slides (optional)
// setInterval(() => {
// if (currentSlide < totalSlides - 1) {
// goToSlide(currentSlide + 1);
// }
// }, 10000);
</script>
</body>
</html>