新建会话
Ctrl
K
Kimi+
历史会话

Kimi K2 实测:Agent 与 Coding 能力

## 以下是我的文章: 标题:Kimi 的新模型,真的好用吗? Kimi K2 发布了 2 天,我也测了 2 天。 如果仔细观察 Kimi 这次的官方发布稿,不难发现 Kimi K2 在强调的重点:Agent 与 Coding 能力。 [图片] 这是很有意思的转变:面向 Agent 时代,把通用 Agent 能力放到了极其重要的位置。 而在实测过程中,Kimi 也确实给了我很多意外之喜。 甚至在部分任务中,比起 Claude、Gemini 毫不逊色,并大幅降低了 Agent 任务的成本。 暂时无法在飞书文档外展示此内容 如果你有段时间没关注 Kimi,或者一直不太相信国产模型的 Agent / Coding 能力。 那么,本文也许能让你的看法有所改变。(甚至还能用 Kimi 代替 Claude Code,文中附教程) --- 照例先介绍下 Kimi K2 Kimi 这次只发了 1 款模型——Kimi K2。 我把官方发布介绍,总结了为了一图流,方便你快速浏览 K2 的特点: [图片] 关键点如下: 1. 总参数 1T,激活参数 32B 的 MoE 模型 2. 主打代码能力、通用 Agent 任务 3. 在多项 benchmark 基准测试中,获得开源模型中的 SOTA 成绩 4. 完全开源;兼容 OpenAI、Anthropic API 格式 我确实一向不太看各种 BenchMark 跑分,纸面 SOTA 不如自己动手测几个场景。 所以,我也对于主打 Coding、Agent 的 Kimi K2,进行了详尽测试,用于观察 Kimi K2 具体表现,也希望能帮你建立初步的模型预期。 --- 实测 Kimi K2 表现 一个大模型,要完成一项 Agent 任务,往往需要强大的自主规划与迭代思考能力,以及调用工具做任务的能力。 而 Coding 能力正是 Agent 执行任务的基础,所以先对代码生成能力进行测试: 💻 代码生成:对比 Claude、Gemini,不落下风 AI Coding 领域,用户对模型的挑剔程度无疑是最高的。 大家只会去用最好、最强的模型。(如果没有特殊原因,放着最好的模型不用,就是给自己的 Coding 过程添堵。) 放眼整个 2025 上半年,开发者在用的 AI Coding 模型只有 1.5 个选择: 1. 绝对主力:Claude 3.7 → 4(Windsurf 被曝要被 OpenAI 收购时,有一批用户担心以后不能用 Claude,直接取消了订阅) 2. 偶尔用用的 Gemini 2.5 Pro(用来做 Coding 的方案规划不错;Gemini Cli 最近风评尚可) 所以,要验证模型的 Coding 能力如何,最直观的方式,还是直接和 Claude、Gemini 比一比。 --- 1)生成 3D Html 山脉:初见 Kimi 新水平 Kimi 官方发布中,有一个测试用例表现很厉害: [图片] 好奇又将信将疑,到底是“只有 Kimi 这么强”,还是“其实 Claude、Gemini 都能做到”? 于是第 1 个 Case,就实测了这个 3D 山脉 Html 生成任务: 创建一个 3D HTML 山脉场景,包含悬崖、河流和昼夜光照变化。支持拖动和缩放、动画过渡、真实感渐变色,并可切换等高线显示 [图片] 以下是 Kimi K2、Claude 4 sonnet、Gemini 2.5 Pro 的对比效果,均按第一次生成结果呈现: (为了确保测试强度拉满,Claude 是默认开启了 Extended-Thinking 模式) 暂时无法在飞书文档外展示此内容 - Kimi: - Gemini: - Claude: 令人惊异,Kimi 在此轮测试中,径直得到了三者中最好的效果: - Kimi:山脉走势美观、河流覆盖真实,有昼夜系统、真实光影 - Claude:抽象的样式,丢失了河流 - Gemini:有山有水,但效果同样不行 要知道在过往模型测试中,国内模型明显比海外好,是一件非常少见的现象,这点打破了我的刻板印象。 考虑到是官方自己选的 Case,所以还是继续上强度,测一些我自己的真实场景。 [图片] --- 2)一图流总结万字长文:依然靠谱 这是一个很高频、实用的任务。也能让你的文章更加好看: 我的每个 AI 产品测试文章都会用 AI 根据文章全文,输出一图流的总结网页。基本只用 Claude、Gemini 生成。 Prompt 如下: ## 以下是我的文章: [粘贴文章内容] ## 任务 我是 AI 科技评测博主,中立客观。请阅读我的文章中的要点,帮我用类似苹果发布会PPT的Bento Grid风格的视觉设计生成一个中文动态网页展示,具体要求为: - 尽量在一页展示全部信息,背景为白色、文字和按钮颜色为纯黑色,高亮色为#4D6BFE - 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差 - 网页需要以响应式兼容更大的显示器宽度比如1920px及以上 - 中英文混用,中文大字体粗体,英文小字作为点缀 - 简洁的勾线图形化作为数据可视化或者配图元素 - 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变 - 数据可以引用在线的图表组件,样式需要跟主题一致 - 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript - 使用专业图标库如Font Awesome或Material Icons(通过CDN引入) - 避免使用emoji作为主要图标 - 不要省略内容要点 这看上去不复杂的任务,实际上考察了两个维度: 1. 准确识别长文本(我测的文章足足有上万字内容)中的内容逻辑,提炼高优先级信息,并重组为结构化表达 2. 根据内容情况,设计合理、美观的排版布局,并用前端代码实现网页 一开始对于不支持 thinking 推理的 Kimi ,在长内容提炼上,没抱有太大的期待。 而这是 Kimi K2、Claude 4 sonnet-thinking、Gemini 2.5 Pro 的表现: [图片] - Kimi: - Gemini: - Claude: 在整个过程中,除了 Gemini 一次性取得了较好的结果以外。 Kimi 也一次性生成成功,初版稍微少了些细节,让它增加一些内容细节,也顺利取得了第 2 个更详细的版本: ——内容完全正确、表达更详尽、排版更合理。(我猜是因为没有 thinking 模式,在生成过程中对于内容的取舍,Kimi 会略微吃亏) 反而是 Claude 4 sonnet-thinking,频频报错,经过 Debug 3 次才取得了完整网页,在布局、样式选用上也不太合理。 [图片] 所以我当时还在即刻上发了一个帖子,表示意外:Kimi K2 已经连续在我测的两个任务里,表现的都比 Claude 4 sonnet-thinking 好了。 甚至不太敢下这个反“刻板印象”的结论。 [图片] 这么整体测下来,其实也能初步看出: Kimi K2 有审美了,代码生成任务也挺稳定。 模型本身进步很明显,真的拉近了与国际 TOP 模型的差距,没准可以在日常 Coding 任务中作为不错的模型选择。 --- 🤖 Agent 能力测试:在实战里,也能真干活了 但 Kimi K2 在单一文件的代码生成上表现惊艳,是否就能意味着它能胜任更复杂的 Agent 任务? 如 Claude Code、Cursor 等 Coding Agent,无不要求 Agentic 模型自主规划任务方案、理解项目 context、调用各类 tools 完成 Coding。 换句话说,Coding Agent 场景,即是当下最适合考验 Agentic 模型能力的基准场景。 我刚好有个自己在做的产品:Chat Memo,拿来给 Kimi 好好上上强度 😈 于是,用 Kimi K2「夺舍」Claude Code(以下代称为 Kimi-code),来执行一次真实需要开发迭代的任务:从 0 理解 Chat Memo 项目,分析完整代码架构,并找到记忆列表卡片的功能与交互逻辑,按指定要求迭代。 (刚好我本周用 Trae + Claude 开发过这个任务,也正好用来比较双方差距) 先输入简单的需求提示: [图片] 如图,Claude Code 的 API Url 是 Kimi 的 API 地址,已经是 CC 的壳,Kimi 的心了。 在 Prompt 发送后,可以看到,Kimi 在收到用户要求后,开始规划任务计划。 然后自主使用 Claude Code 内封装的工具,对完整的项目内容进行查找、分析,并对代码进行修改编写: [图片] [图片] ……Kimi,你为什么用 Claude 的工具这么熟练啊?总感觉有种 Claude 被 Kimi NTR 的感觉 整个过程很顺利,经过几分钟的 Coding 过程,“Kimi Code”就一次性执行完毕,输出如下: [图片] 为了方便对比最终的 Agent 任务效果,我先展示下迭代之前的原版: [图片] 而这是经过 Kimi-Code 自主一次性迭代后的版本: 暂时无法在飞书文档外展示此内容 另外,这是之前 Trae + Claude 4 sonnet 多轮提示后,开发的版本: 暂时无法在飞书文档外展示此内容 甚至我更喜欢 Kimi 的效果细节(hover 的交互样式更加合理,不知道你是否能看出来区别)。 而这项 Agent 任务的费用,我在 Kimi 开放平台看了下 API 用量,只要 5 毛钱。 Btw:值得注意的是,Claude Code 中的所有 Prompt、工具,都是为了 Claude AI 自身所开发封装的。 而 Kimi 作为一个外来 Agent 模型,能在未经适配的环境下,体现出了极强的泛化与适应能力,顺利完成任务,展现了一流的 Agentic 智力。 ——说句“Kimi 通过自主使用 CC,实现了 Trae + Claude 4 sonnet 同样的 Coding 实战效果”,并不过分。 [图片] 如对 Kimi K2 夺舍 Claude Code 的方法感兴趣,下文也提供了详细的教程指引。 小结:Kimi K2 通过 Claude Code ,能稳定完成实际项目的 Coding Agent 任务。值得推荐读者针对自身情况,进一步测试体验。 --- 🗂️ 更多测试:整体顺利,点赞 另外,我也继续用 Kimi Code 测试了很多其他的 Agent 任务,但受限于篇幅,不再一一列举过程。 直接呈现一些关键结果: 1)从 0 到 1,开发一款生死时速 Html 游戏 [图片] Kimi 的任务规划: [图片] 一次性开发效果如下: 暂时无法在飞书文档外展示此内容 正如上文所言,毕竟 Kimi 用的是 Claude Code 的工具,很多 Prompt、参数的封装和 K2 其实并未适配。 在后续迭代测试时,偶尔会出现Invalid tool parameters的报错,导致任务进程中断,可以理解。也期待 Kimi 下次发布真正的 Kimi Code,充分发挥 K2 的 Agent 能力。 --- 2)批处理本地文件,整合数据为表格 要求 Kimi 自行阅读 48 份 txt 文档,将每篇文档的元信息统一提取制表: [图片] [图片] 整体也很顺利: [图片] Kimi 生成的 Markdown 文件内容如下: [图片] 数据内容没有任何问题。 Kimi 在读取本地内容,进行数据处理的任务,同样通过了基础测试。 --- 不止如此:远比 Claude 便宜的价格,以及彻底的开源 还记得上面 Chat Memo 的迭代任务,只花了 0.5 元的 token 费用吗? 其实包含后文的全部测试,全部跑下来也只花了不到 1 美金。 是的,Kimi K2 这个 1T 总参数、32B 激活参数的 MoE 模型,不仅在能力上让人惊喜,在价格和开放性上也有着相当的诚意。 [图片] 相比 Claude Sonnet 4 的 3 美金/百万 tokens,Kimi K2 只需要其 20% 的价格,即可换来接近的 Coding 表现: - 每百万输入 tokens:4 元 - 每百万输出 tokens:16 元 也兼容 OpenAI 和 Anthropic 的 API 格式,可以无缝集成到现有的 Agent 程序里,大幅降低了开发者的迁移成本。 所以,除了普通用户可以在 中可以直接体验 K2 外,AI 应用公司们也能通过 API 低成本用 Kimi K2 来构造一些本土 Agent、Coding 应用了。 另外,月之暗面也在同一时间开源了 Kimi K2 的两个版本: - Kimi-K2-Base:未经过指令微调的基础预训练模型,适合需要进行深度自定义和学术研究的场景。 - Kimi-K2-Instruct:通用指令微调版本,在 Coding / Agent 任务中表现优异,开箱即用。 官方已将模型与权重文件开源至 Hugging Face: --- 🎐 写在最后:Kimi K2,不止于“纸面 SOTA” 横向对比也好、真实场景实测也罢,我觉得可以下一个明确的结论了: Kimi K2 并非只是在跑分上好看的模型。 在这两天贴近真实环境的测试中,Kimi 切实展现出了接近国际顶尖模型的 Agent / Coding 能力。 它的进步在两个关键维度上肉眼可见: 1. 代码能力不再是短板:无论是一次成型的 3D 动态山脉,还是准确理解上万字长文并生成 Bento Grid 风格一图流,Kimi K2 的代码生成质量和审美,都完全不输 Claude 和 Gemini。这直接打破了我对国产模型“不擅代码、审美一般”的刻板印象。 2. Agent 能力更是惊喜:在「Chat Memo」项目的真实迭代需求测试中,Kimi K2 仅凭 Claude Code 这个未经适配的 Agent 外壳,达到了需要 Trae + Claude 多轮 Prompt 才取得的同等开发结果。 [图片] 它能从零开始自主理解项目架构、自主规划任务、并调用(非原生的)工具完成开发。 仅凭一个未经适配的 Claude Code ,就能出色完成任务,已经证明了 Kimi K2 作为 一个 Agentic 模型的核心能力:一流的智力与出色的泛化能力。 (2025 年下半年,凭借越来越好用的国产开源 Agentic 模型,垂直 Agent 赛道无疑将真正卷出天际) --- 大模型发展到 2025 年中这个阶段,简单的 Chat 问答测试,已经开始很难去评判模型水平的高低。 未来模型能力的较量,将发生在各个真实的项目里,发生在每一次 Context 理解、自主规划、工具调用、任务执行中。 届时,衡量是否选用一个模型的标准,将是一个更朴素、也更严苛的复合指标:综合可用性。它包含了三个核心维度: - 质量: 在我的目标任务上,它能做到什么程度? - 效率: 它完成任务的速度有多快、多稳定? - 成本: 完成这个结果,需要多少费用? 谁能让 AI 变得更好用、靠谱、便宜,谁就能在下一阶段的 AI Agent 应用浪潮中,赢得更广泛的开发者与用户。 而这一轮,Kimi K2 准备得相当不错。 ## 任务 我是 AI 科技评测博主,中立客观。请阅读我的文章中的要点,帮我用类似苹果发布会PPT的Bento Grid风格的视觉设计生成一个中文网页展示,具体要求为: - 尽量在一页展示全部信息,背景为白色、文字和按钮颜色为纯黑色,高亮色为#4D6BFE - 强调超大字体或数字突出核心要点,画面中有超大视觉元素强调重点,与小元素的比例形成反差 - 网页需要以响应式兼容更大的显示器宽度比如1920px及以上 - 中英文混用,中文大字体粗体,英文小字作为点缀 - 简洁的勾线图形化作为数据可视化或者配图元素 - 运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变 - 数据可以引用在线的图表组件,样式需要跟主题一致 - 使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript - 使用专业图标库如Font Awesome或Material Icons(通过CDN引入) - 避免使用emoji作为主要图标 - 不要省略内容要点 - 布局合理平衡,没有突兀的留白
HTML
预览
复制
<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Kimi K2 全面实测报告</title>
    <script src="https://cdn.tailwindcss.com"></script>
    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.0/css/all.min.css">
    <style>
        :root {
            --brand-blue: #4D6BFE;
        }
        
        .bg-brand { background-color: var(--brand-blue); }
        .text-brand { color: var(--brand-blue); }
        .border-brand { border-color: var(--brand-blue); }
        
        .hero-title {
            font-size: clamp(3rem, 8vw, 6rem);
            font-weight: 900;
            line-height: 0.9;
            letter-spacing: -0.02em;
        }
        
        .highlight-card {
            background: linear-gradient(135deg, rgba(77, 107, 254, 0.05) 0%, rgba(77, 107, 254, 0.02) 100%);
            border: 1px solid rgba(77, 107, 254, 0.1);
        }
        
        .metric-number {
            font-size: clamp(2.5rem, 5vw, 4rem);
            font-weight: 900;
            color: var(--brand-blue);
            line-height: 1;
        }
        
        .grid-bento {
            display: grid;
            grid-template-columns: 2fr 1fr 1fr;
            grid-template-rows: auto auto auto;
            gap: 1.5rem;
            max-width: 1920px;
            margin: 0 auto;
        }
        
        .bento-main { grid-column: 1 / 2; grid-row: 1 / 3; }
        .bento-side1 { grid-column: 2 / 4; grid-row: 1 / 2; }
        .bento-side2 { grid-column: 2 / 3; grid-row: 2 / 3; }
        .bento-side3 { grid-column: 3 / 4; grid-row: 2 / 3; }
        .bento-wide { grid-column: 1 / 4; grid-row: 3 / 4; }
        
        @media (max-width: 1024px) {
            .grid-bento {
                grid-template-columns: 1fr;
                grid-template-rows: auto;
            }
            .bento-main, .bento-side1, .bento-side2, .bento-side3, .bento-wide {
                grid-column: 1;
                grid-row: auto;
            }
        }
        
        .icon-large {
            font-size: 4rem;
            color: var(--brand-blue);
            opacity: 0.2;
        }
        
        .test-card {
            transition: all 0.3s ease;
        }
        
        .test-card:hover {
            transform: translateY(-4px);
            box-shadow: 0 20px 40px rgba(77, 107, 254, 0.1);
        }
    </style>
</head>
<body class="bg-white text-black font-sans">
    <div class="min-h-screen p-6 lg:p-12">
        <!-- Hero Section -->
        <section class="mb-16">
            <div class="text-center mb-12">
                <h1 class="hero-title mb-4">Kimi K2</h1>
                <p class="text-2xl font-light text-gray-600">不止是纸面 SOTA</p>
                <p class="text-lg text-gray-500 mt-2">实测打破刻板印象的国产 Agent 模型</p>
            </div>
            
            <div class="grid-bento">
                <!-- Main Card -->
                <div class="highlight-card rounded-3xl p-8 lg:p-12 bento-main">
                    <div class="flex items-start justify-between mb-6">
                        <div>
                            <h2 class="text-3xl font-bold mb-2">核心突破</h2>
                            <p class="text-gray-600">Coding & Agent 能力双重进化</p>
                        </div>
                        <i class="fas fa-rocket icon-large"></i>
                    </div>
                    <div class="space-y-4">
                        <div class="flex items-center">
                            <div class="w-3 h-3 bg-brand rounded-full mr-3"></div>
                            <span class="text-lg">代码能力对标 Claude 4</span>
                        </div>
                        <div class="flex items-center">
                            <div class="w-3 h-3 bg-brand rounded-full mr-3"></div>
                            <span class="text-lg">Agent 任务泛化能力</span>
                        </div>
                        <div class="flex items-center">
                            <div class="w-3 h-3 bg-brand rounded-full mr-3"></div>
                            <span class="text-lg">成本仅为 Claude 20%</span>
                        </div>
                    </div>
                </div>
                
                <!-- Metrics -->
                <div class="highlight-card rounded-3xl p-6 bento-side1 flex items-center justify-between">
                    <div>
                        <div class="metric-number">1T</div>
                        <p class="text-sm text-gray-600">总参数</p>
                    </div>
                    <div class="text-right">
                        <div class="metric-number">32B</div>
                        <p class="text-sm text-gray-600">激活参数</p>
                    </div>
                </div>
                
                <!-- Price -->
                <div class="highlight-card rounded-3xl p-6 bento-side2 flex items-center justify-center">
                    <div class="text-center">
                        <div class="text-4xl font-bold text-brand mb-1">¥0.5</div>
                        <p class="text-sm text-gray-600">完成复杂任务</p>
                    </div>
                </div>
                
                <!-- Open Source -->
                <div class="highlight-card rounded-3xl p-6 bento-side3 flex items-center justify-center">
                    <div class="text-center">
                        <i class="fas fa-code-branch text-4xl text-brand mb-2"></i>
                        <p class="text-sm font-bold">完全开源</p>
                    </div>
                </div>
            </div>
        </section>
        
        <!-- Test Results -->
        <section class="mb-16">
            <h2 class="text-4xl font-bold mb-8 text-center">实测对比结果</h2>
            
            <div class="grid lg:grid-cols-3 gap-8">
                <!-- 3D Mountains Test -->
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6">
                        <i class="fas fa-mountain text-3xl text-brand mr-4"></i>
                        <h3 class="text-2xl font-bold">3D 山脉生成</h3>
                    </div>
                    <div class="space-y-4">
                        <div class="flex justify-between items-center">
                            <span class="font-bold">Kimi K2</span>
                            <span class="text-brand font-bold">✅ 最佳</span>
                        </div>
                        <div class="flex justify-between items-center">
                            <span>Claude 4</span>
                            <span class="text-gray-500">效果一般</span>
                        </div>
                        <div class="flex justify-between items-center">
                            <span>Gemini 2.5</span>
                            <span class="text-gray-500">表现平平</span>
                        </div>
                    </div>
                    <p class="text-sm text-gray-600 mt-4">山脉走势美观、河流真实、昼夜系统完整</p>
                </div>
                
                <!-- Article Summary -->
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6">
                        <i class="fas fa-file-alt text-3xl text-brand mr-4"></i>
                        <h3 class="text-2xl font-bold">万字长文总结</h3>
                    </div>
                    <div class="space-y-4">
                        <div class="flex justify-between items-center">
                            <span class="font-bold">Kimi K2</span>
                            <span class="text-brand font-bold">✅ 一次性成功</span>
                        </div>
                        <div class="flex justify-between items-center">
                            <span>Claude 4</span>
                            <span class="text-red-500">需调试3次</span>
                        </div>
                        <div class="flex justify-between items-center">
                            <span>Gemini 2.5</span>
                            <span class="text-gray-500">尚可</span>
                        </div>
                    </div>
                    <p class="text-sm text-gray-600 mt-4">准确提炼要点,Bento Grid 设计美观</p>
                </div>
                
                <!-- Agent Task -->
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6">
                        <i class="fas fa-robot text-3xl text-brand mr-4"></i>
                        <h3 class="text-2xl font-bold">Agent 实战</h3>
                    </div>
                    <div class="space-y-4">
                        <div class="text-center">
                            <div class="text-5xl font-bold text-brand mb-2">100%</div>
                            <p class="text-sm text-gray-600">任务完成率</p>
                        </div>
                        <div class="bg-gray-100 rounded-lg p-3">
                            <p class="text-sm font-bold mb-1">Chat Memo 迭代</p>
                            <p class="text-xs text-gray-600">从0理解项目到功能迭代,一次性成功</p>
                        </div>
                    </div>
                </div>
            </div>
        </section>
        
        <!-- Technical Details -->
        <section class="mb-16">
            <div class="highlight-card rounded-3xl p-8 lg:p-12">
                <h2 class="text-3xl font-bold mb-8">技术规格与成本</h2>
                <div class="grid md:grid-cols-2 gap-8">
                    <div>
                        <h3 class="text-xl font-bold mb-4">模型架构</h3>
                        <div class="space-y-3">
                            <div class="flex justify-between">
                                <span>类型</span>
                                <span class="font-bold">MoE 混合专家模型</span>
                            </div>
                            <div class="flex justify-between">
                                <span>总参数</span>
                                <span class="font-bold">1T</span>
                            </div>
                            <div class="flex justify-between">
                                <span>激活参数</span>
                                <span class="font-bold">32B</span>
                            </div>
                            <div class="flex justify-between">
                                <span>开源状态</span>
                                <span class="font-bold text-brand">完全开源</span>
                            </div>
                        </div>
                    </div>
                    <div>
                        <h3 class="text-xl font-bold mb-4">API 定价</h3>
                        <div class="space-y-3">
                            <div class="flex justify-between">
                                <span>输入 tokens</span>
                                <span class="font-bold">¥4 / 百万</span>
                            </div>
                            <div class="flex justify-between">
                                <span>输出 tokens</span>
                                <span class="font-bold">¥16 / 百万</span>
                            </div>
                            <div class="flex justify-between">
                                <span>vs Claude 4</span>
                                <span class="font-bold text-brand">仅 20% 成本</span>
                            </div>
                        </div>
                    </div>
                </div>
            </div>
        </section>
        
        <!-- Call to Action -->
        <section class="text-center">
            <div class="highlight-card rounded-3xl p-12">
                <h2 class="text-3xl font-bold mb-4">立即体验 Kimi K2</h2>
                <p class="text-gray-600 mb-8">打破对国产模型的刻板印象</p>
                <div class="flex flex-col sm:flex-row gap-4 justify-center">
                    <a href="https://www.kimi.com/" class="bg-brand text-white px-8 py-4 rounded-2xl font-bold hover:bg-opacity-90 transition-all">
                        在线体验
                    </a>
                    <a href="https://huggingface.co/moonshotai/Kimi-K2-Instruct" class="border-2 border-brand text-brand px-8 py-4 rounded-2xl font-bold hover:bg-brand hover:text-white transition-all">
                        开源代码
                    </a>
                </div>
            </div>
        </section>
    </div>
    
    <script>
        // 响应式处理
        const observer = new IntersectionObserver((entries) => {
            entries.forEach(entry => {
                if (entry.isIntersecting) {
                    entry.target.style.opacity = '1';
                    entry.target.style.transform = 'translateY(0)';
                }
            });
        });
        
        document.querySelectorAll('.test-card').forEach(card => {
            card.style.opacity = '0';
            card.style.transform = 'translateY(20px)';
            card.style.transition = 'opacity 0.6s ease, transform 0.6s ease';
            observer.observe(card);
        });
    </script>
</body>
</html>
3D 山脉生成 中,claude、gemini 都是表现不佳;万字长文总结里,Gemini 也是一次成功。 0.5 元完成复杂任务,应该改为完成中等 Coding 任务。 agent 实战 100% 完成率,应该改为较高完成率,比较难量化。 然后技术规格与成本下面,可以增加一块结语,用我文章写在最后的结论进行提炼与排版
HTML
预览
复制
<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Kimi K2 全面实测报告</title>
    <script src="https://cdn.tailwindcss.com"></script>
    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.0/css/all.min.css">
    <style>
        :root { --brand-blue: #4D6BFE; }
        .bg-brand { background-color: var(--brand-blue); }
        .text-brand { color: var(--brand-blue); }
        .border-brand { border-color: var(--brand-blue); }
        .hero-title {
            font-size: clamp(3rem, 8vw, 6rem);
            font-weight: 900;
            line-height: 0.9;
            letter-spacing: -0.02em;
        }
        .highlight-card {
            background: linear-gradient(135deg, rgba(77,107,254,.05) 0%, rgba(77,107,254,.02) 100%);
            border: 1px solid rgba(77,107,254,.1);
        }
        .metric-number {
            font-size: clamp(2.5rem, 5vw, 4rem);
            font-weight: 900;
            color: var(--brand-blue);
            line-height: 1;
        }
        .grid-bento {
            display: grid;
            grid-template-columns: 2fr 1fr 1fr;
            grid-template-rows: auto auto auto;
            gap: 1.5rem;
            max-width: 1920px;
            margin: 0 auto;
        }
        .bento-main { grid-column: 1 / 2; grid-row: 1 / 3; }
        .bento-side1 { grid-column: 2 / 4; grid-row: 1 / 2; }
        .bento-side2 { grid-column: 2 / 3; grid-row: 2 / 3; }
        .bento-side3 { grid-column: 3 / 4; grid-row: 2 / 3; }
        .bento-wide { grid-column: 1 / 4; grid-row: 3 / 4; }
        @media(max-width:1024px){
            .grid-bento { grid-template-columns:1fr; grid-template-rows:auto; }
            .bento-main,.bento-side1,.bento-side2,.bento-side3,.bento-wide{grid-column:1;grid-row:auto}
        }
        .test-card{transition:all .3s ease}
        .test-card:hover{transform:translateY(-4px);box-shadow:0 20px 40px rgba(77,107,254,.1)}
    </style>
</head>
<body class="bg-white text-black font-sans">
    <div class="min-h-screen p-6 lg:p-12">
        <!-- HERO -->
        <section class="mb-16">
            <div class="text-center mb-12">
                <h1 class="hero-title mb-4">Kimi K2</h1>
                <p class="text-2xl font-light text-gray-600">不止是纸面 SOTA</p>
                <p class="text-lg text-gray-500 mt-2">实测打破刻板印象的国产 Agent 模型</p>
            </div>
            <div class="grid-bento">
                <div class="highlight-card rounded-3xl p-8 lg:p-12 bento-main">
                    <div class="flex items-start justify-between mb-6">
                        <div>
                            <h2 class="text-3xl font-bold mb-2">核心突破</h2>
                            <p class="text-gray-600">Coding & Agent 能力双重进化</p>
                        </div>
                        <i class="fas fa-rocket text-6xl text-brand opacity-20"></i>
                    </div>
                    <div class="space-y-4">
                        <div class="flex items-center"><div class="w-3 h-3 bg-brand rounded-full mr-3"></div><span class="text-lg">代码能力对标 Claude 4</span></div>
                        <div class="flex items-center"><div class="w-3 h-3 bg-brand rounded-full mr-3"></div><span class="text-lg">Agent 任务泛化能力</span></div>
                        <div class="flex items-center"><div class="w-3 h-3 bg-brand rounded-full mr-3"></div><span class="text-lg">成本仅为 Claude 20%</span></div>
                    </div>
                </div>
                <div class="highlight-card rounded-3xl p-6 bento-side1 flex items-center justify-around text-center">
                    <div><div class="metric-number">1T</div><p class="text-sm text-gray-600">总参数</p></div>
                    <div><div class="metric-number">32B</div><p class="text-sm text-gray-600">激活参数</p></div>
                </div>
                <div class="highlight-card rounded-3xl p-6 bento-side2 flex items-center justify-center text-center">
                    <div><div class="text-4xl font-bold text-brand mb-1">¥0.5</div><p class="text-sm text-gray-600">中等 Coding 任务</p></div>
                </div>
                <div class="highlight-card rounded-3xl p-6 bento-side3 flex items-center justify-center text-center">
                    <div><i class="fas fa-code-branch text-4xl text-brand mb-2"></i><p class="text-sm font-bold">完全开源</p></div>
                </div>
            </div>
        </section>

        <!-- TEST RESULTS -->
        <section class="mb-16">
            <h2 class="text-4xl font-bold mb-8 text-center">实测对比结果</h2>
            <div class="grid lg:grid-cols-3 gap-8">
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6"><i class="fas fa-mountain text-3xl text-brand mr-4"></i><h3 class="text-2xl font-bold">3D 山脉生成</h3></div>
                    <div class="space-y-4">
                        <div class="flex justify-between"><span class="font-bold">Kimi K2</span><span class="text-brand font-bold">✅ 最佳</span></div>
                        <div class="flex justify-between"><span>Claude 4</span><span class="text-gray-500">表现不佳</span></div>
                        <div class="flex justify-between"><span>Gemini 2.5</span><span class="text-gray-500">表现不佳</span></div>
                    </div>
                    <p class="text-sm text-gray-600 mt-4">山脉走势美观、河流真实、昼夜系统完整</p>
                </div>
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6"><i class="fas fa-file-alt text-3xl text-brand mr-4"></i><h3 class="text-2xl font-bold">万字长文总结</h3></div>
                    <div class="space-y-4">
                        <div class="flex justify-between"><span class="font-bold">Kimi K2</span><span class="text-brand font-bold">✅ 一次性成功</span></div>
                        <div class="flex justify-between"><span>Gemini 2.5</span><span class="text-gray-500">一次性成功</span></div>
                        <div class="flex justify-between"><span>Claude 4</span><span class="text-red-500">需调试3次</span></div>
                    </div>
                    <p class="text-sm text-gray-600 mt-4">准确提炼要点,Bento Grid 设计美观</p>
                </div>
                <div class="test-card highlight-card rounded-3xl p-8">
                    <div class="flex items-center mb-6"><i class="fas fa-robot text-3xl text-brand mr-4"></i><h3 class="text-2xl font-bold">Agent 实战</h3></div>
                    <div class="space-y-4">
                        <div class="text-center"><div class="text-5xl font-bold text-brand mb-2">较高</div><p class="text-sm text-gray-600">完成率</p></div>
                        <div class="bg-gray-100 rounded-lg p-3">
                            <p class="text-sm font-bold mb-1">Chat Memo 迭代</p>
                            <p class="text-xs text-gray-600">从0理解项目到功能迭代,表现优异</p>
                        </div>
                    </div>
                </div>
            </div>
        </section>

        <!-- SPEC & COST -->
        <section class="mb-16">
            <div class="highlight-card rounded-3xl p-8 lg:p-12">
                <h2 class="text-3xl font-bold mb-8">技术规格与成本</h2>
                <div class="grid md:grid-cols-2 gap-8">
                    <div>
                        <h3 class="text-xl font-bold mb-4">模型架构</h3>
                        <div class="space-y-3">
                            <div class="flex justify-between"><span>类型</span><span class="font-bold">MoE 混合专家模型</span></div>
                            <div class="flex justify-between"><span>总参数</span><span class="font-bold">1T</span></div>
                            <div class="flex justify-between"><span>激活参数</span><span class="font-bold">32B</span></div>
                            <div class="flex justify-between"><span>开源状态</span><span class="font-bold text-brand">完全开源</span></div>
                        </div>
                    </div>
                    <div>
                        <h3 class="text-xl font-bold mb-4">API 定价</h3>
                        <div class="space-y-3">
                            <div class="flex justify-between"><span>输入 tokens</span><span class="font-bold">¥4 / 百万</span></div>
                            <div class="flex justify-between"><span>输出 tokens</span><span class="font-bold">¥16 / 百万</span></div>
                            <div class="flex justify-between"><span>vs Claude 4</span><span class="font-bold text-brand">仅 20% 成本</span></div>
                        </div>
                    </div>
                </div>
            </div>
        </section>

        <!-- CONCLUSION -->
        <section class="mb-16">
            <div class="bg-brand text-white rounded-3xl p-8 lg:p-12">
                <h2 class="text-3xl font-bold mb-6">写在最后</h2>
                <div class="grid md:grid-cols-2 gap-8">
                    <div>
                        <h3 class="text-xl font-bold mb-3">不再是短板</h3>
                        <p class="text-sm leading-relaxed opacity-90">
                            无论是 3D 动态山脉还是万字长文 Bento Grid,Kimi K2 的代码生成质量与审美已完全不输 Claude 与 Gemini。
                        </p>
                    </div>
                    <div>
                        <h3 class="text-xl font-bold mb-3">Agent 泛化能力</h3>
                        <p class="text-sm leading-relaxed opacity-90">
                            在未经适配的 Claude Code 中依旧出色完成真实项目迭代,展现一流智力与泛化能力。
                        </p>
                    </div>
                </div>
                <div class="mt-8 pt-6 border-t border-white/20">
                    <p class="text-center text-lg font-bold">
                        质量 × 效率 × 成本 的三重突破,让 Kimi K2 成为下一阶段 AI Agent 应用浪潮中的强力选择。
                    </p>
                </div>
            </div>
        </section>

        <!-- CTA -->
        <section class="text-center">
            <div class="highlight-card rounded-3xl p-12">
                <h2 class="text-3xl font-bold mb-4">立即体验 Kimi K2</h2>
                <p class="text-gray-600 mb-8">打破对国产模型的刻板印象</p>
                <div class="flex flex-col sm:flex-row gap-4 justify-center">
                    <a href="https://www.kimi.com/" class="bg-brand text-white px-8 py-4 rounded-2xl font-bold hover:bg-opacity-90 transition-all">在线体验</a>
                    <a href="https://huggingface.co/moonshotai/Kimi-K2-Instruct" class="border-2 border-brand text-brand px-8 py-4 rounded-2xl font-bold hover:bg-brand hover:text-white transition-all">开源代码</a>
                </div>
            </div>
        </section>
    </div>
</body>
</html>