Kimi K2.7 Code

Mô hình agentic mã nguồn mở, chuyên về lập trình, được xây dựng cho các tác vụ kỹ thuật phần mềm dài hơi

8 phút đọc2026-06-18

Kimi K2.7 Code là gì?

Kimi K2.7 Code là mô hình agentic mã nguồn mở, chuyên về lập trình do Moonshot AI phát triển. Mô hình mang lại năng lực lập trình và hiệu suất agent mạnh hơn, với những cải thiện đáng kể trong các tác vụ lập trình dài hơi ngoài thực tế. Những tiến bộ này giúp nâng tỷ lệ hoàn thành tác vụ đầu-cuối trong các quy trình kỹ thuật phần mềm phức tạp. K2.7 Code cũng cải thiện hiệu quả suy luận, giảm mức sử dụng thinking-token khoảng 30% so với K2.6.

Hiệu năng benchmark

Kimi K2.7 Code được đánh giá so với K2.6 trên tổ hợp benchmark nội bộ và bên ngoài, bao quát hai khía cạnh: năng lực lập trình và thực thi tác vụ agentic.

So sánh benchmark giữa Kimi K2.7 Code, Kimi K2.6, GPT-5.5 và Claude Opus 4.8 trên sáu benchmark về lập trình và agentic

Trên các benchmark lập trình, K2.7 Code cho thấy mức cải thiện đáng kể so với K2.6: +21,8% trên Kimi Code Bench v2 (62,0 so với 50,9), +11,0% trên Program Bench (53,6 so với 48,3) và +31,5% trên MLS Bench Lite (35,1 so với 26,7).

Năng lực lập trình mạnh hơn cũng chuyển hóa thành hiệu suất agentic tốt hơn. Trên Kimi Claw 24/7 Bench, MCP Atlas và MCP Mark Verified — các benchmark đo khả năng thực thi tác vụ tự chủ của agent — K2.7 Code cải thiện khoảng 10% so với K2.6.

Lập trình:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentic:

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

Kimi Code Bench v2 là benchmark nội bộ do Moonshot AI phát triển, còn Kimi Claw 24/7 Bench là benchmark nội bộ dành cho đánh giá agentic. Kimi K2.7 Code và K2.6 được thử nghiệm qua Kimi Code CLI với chế độ suy nghĩ được bật (temperature 1.0, top-p 0.95, ngữ cảnh 262.144-token), trong khi GPT-5.5 được đánh giá trong Codex (xhigh) và Opus 4.8 trong Claude Code (xhigh). Các ngoại lệ theo từng benchmark và phương pháp đầy đủ được trình bày chi tiết trong model card trên Hugging Face.

Được xây dựng cho lập trình dài hơi

Kỹ thuật phần mềm trong thực tế hiếm khi kết thúc chỉ sau một bước. Những tác vụ như tái cấu trúc codebase, triển khai một tính năng trên nhiều tệp hoặc gỡ lỗi qua các phiên agent kéo dài đòi hỏi mô hình phải bám sát chỉ dẫn một cách tin cậy trong ngữ cảnh mở rộng và đưa tác vụ đến khi hoàn tất.

Kimi K2.7 Code được tối ưu cho các kịch bản dài hơi này. So với K2.6, mô hình tuân thủ chỉ dẫn đáng tin cậy hơn trong ngữ cảnh dài và đạt tỷ lệ hoàn thành tác vụ đầu-cuối cao hơn, nhờ đó phù hợp hơn với các quy trình kỹ thuật phần mềm phức tạp.

Thử trong Kimi Code

Hiệu quả suy luận được tối ưu

Các mô hình suy luận thường có xu hướng nghĩ quá nhiều, tiêu tốn hàng nghìn tokens để cân nhắc những vấn đề không cần đến mức đó. Kimi K2.7 Code giảm đáng kể xu hướng này: trung bình cắt giảm khoảng 30% mức sử dụng thinking-token so với K2.6.

Trên Kimi Code Bench v2, Program Bench và MLS Bench Lite, Kimi K2.7 Code đạt điểm cao hơn K2.6 trong khi tiêu thụ ít tokens hơn ở từng benchmark.

Hiệu năng so với số tokens của Kimi K2.7 Code

Với nhà phát triển, hiệu quả này tích lũy qua từng tác vụ: phản hồi nhanh hơn trong các phiên lập trình tương tác, chi phí API thấp hơn khi chạy production, và các quy trình agent hoàn thành được nhiều việc hơn trong cùng một ngân sách ngữ cảnh.

Thử trong Kimi Code

Kiến trúc mô hình

Kimi K2.7 Code được xây dựng trên kiến trúc Mixture-of-Experts (MoE) với tổng cộng 1 nghìn tỷ tham số và 32 tỷ tham số được kích hoạt trên mỗi token. Mô hình hỗ trợ độ dài ngữ cảnh 256K và sử dụng Multi-head Latent Attention (MLA). Mô hình cũng tích hợp MoonViT, bộ mã hóa thị giác 400M tham số.

Tham số	Giá trị
Kiến trúc	Mixture-of-Experts (MoE)
Tổng số tham số	1T
Tham số được kích hoạt	32B
Số lớp (bao gồm lớp Dense)	61
Số lớp Dense	1
Chiều ẩn Attention	7168
Chiều ẩn MoE (mỗi Expert)	2048
Số Attention Head	64
Số Expert	384
Expert được chọn trên mỗi token	8
Số Shared Expert	1
Kích thước từ vựng	160K
Độ dài ngữ cảnh	256K
Cơ chế Attention	MLA
Hàm kích hoạt	SwiGLU
Bộ mã hóa thị giác	MoonViT
Tham số của bộ mã hóa thị giác	400M

Toàn bộ trọng số mô hình đã được mở nguồn và có trên Hugging Face.

Lựa chọn giữa Kimi K2.7 Code và K2.6

Kimi K2.7 Code được thiết kế riêng cho các tác vụ lập trình. Với các công việc đa dụng như viết, phân tích và trò chuyện, chúng tôi khuyến nghị K2.6 vì có năng lực cân bằng hơn.

Cách truy cập Kimi K2.7 Code

Có thể sử dụng ở đâu

Kimi K2.7 Code hiện có qua:

Kimi Code (https://www.kimi.com/code). Kimi K2.7 Code hiện là mô hình mặc định, với chế độ suy nghĩ được bật sẵn. Để bắt đầu, hãy làm theo hướng dẫn thiết lập trên trang.
Kimi API trên nền tảng mở (https://platform.kimi.ai/). Nhà phát triển có thể gọi Kimi K2.7 Code qua Kimi API và tích hợp vào quy trình lập trình, agents và công cụ phát triển của riêng mình.

Yêu cầu về chế độ suy nghĩ

Kimi K2.7 Code không hỗ trợ chế độ không suy nghĩ. Mô hình luôn chạy với chế độ suy nghĩ được bật, cả trên Kimi API lẫn Kimi Code. Trong Kimi Code, các yêu cầu gửi khi tắt chế độ suy nghĩ sẽ tự động được K2.6 xử lý thay thế.

Giá Kimi K2.7 Code

Các gói Kimi Code

Với người dùng muốn trải nghiệm Kimi K2.7 Code trực tiếp qua Kimi Code, bao gồm terminal và plugin IDE, bạn có thể chọn các gói Code của chúng tôi. Giá dưới đây là giá hằng tháng khi thanh toán theo năm:

Gói	Giá	Phù hợp nhất cho
Moderato	$15 / tháng	Người dùng cần hạn mức sử dụng được làm mới hằng tuần và truy cập đa thiết bị cho các quy trình lập trình thường xuyên
Allegretto	$31 / tháng	Người dùng nâng cao cần hạn mức hằng tuần lớn hơn và giới hạn đồng thời cao hơn
Allegro	$79 / tháng	Người dùng thực hiện các tác vụ phát triển chuyên sâu, dự án phức tạp và khối lượng công việc lớn hơn
Vivace	$159 / tháng	Người dùng cần hạn mức gói hằng tuần cao nhất cho các dự án phức tạp và codebase lớn

Mỗi gói bao gồm hạn mức sử dụng được làm mới hằng tuần. Các gói cấp cao hơn cung cấp hạn mức hằng tuần lớn hơn và giới hạn đồng thời cao hơn, phù hợp với các dự án phức tạp hơn.Để xem thông tin gói mới nhất, hãy truy cập trang thành viên chính thức.

Giá Kimi API

Kimi K2.7 Code có thể được sử dụng qua Kimi API với cách tính phí theo mức sử dụng, theo từng token:

Mô hình	Đơn vị	Giá đầu vào (Cache Hit)	Giá đầu vào (Cache Miss)	Giá đầu ra	Cửa sổ ngữ cảnh
kimi-k2.7-code	1M tokens	$0.19	$0.95	$4.00	262,144 tokens

API hỗ trợ lưu cache ngữ cảnh tự động, giúp giảm chi phí đầu vào cho ngữ cảnh được tái sử dụng (cache hit $0.19 so với cache miss $0.95 trên mỗi triệu tokens). Giá chưa bao gồm các loại thuế áp dụng. Xem tài liệu giá chính thức để biết mức giá mới nhất.

Câu hỏi thường gặp

Kimi K2.7 Code có phải là mã nguồn mở không?

Có. Trọng số của mô hình đã được mở nguồn và có thể tải xuống trên Hugging Face; tại đó bạn cũng có thể tìm thấy hướng dẫn triển khai và tài liệu đầy đủ.

Cửa sổ ngữ cảnh của Kimi K2.7 Code là bao nhiêu?

Kimi K2.7 Code hỗ trợ cửa sổ ngữ cảnh 256K (262.144 tokens), rất phù hợp với các codebase ở quy mô repository và những phiên lập trình nhiều lượt, kéo dài.

Kimi K2.7 Code có hỗ trợ đầu vào hình ảnh và video không?

Có. Kimi K2.7 Code sử dụng kiến trúc đa phương thức gốc, hỗ trợ đầu vào văn bản, hình ảnh và video, bên cạnh các năng lực lập trình và agentic.

Có bắt buộc bật chế độ suy nghĩ để dùng Kimi K2.7 Code không?

Có. Kimi K2.7 Code không hỗ trợ chế độ không suy nghĩ và luôn chạy với tính năng suy nghĩ được bật. Trong Kimi Code, các yêu cầu tắt suy nghĩ sẽ tự động được K2.6 xử lý thay thế.