Giải thích bảng giá Kimi K2.7 Code: chi phí và gói API

8 phút đọc2026-06-25
Bảng giá Kimi K2.7 Code API

Các gói hội viên & hạng mức sử dụng Kimi K2.7 Code

Nếu muốn dùng Kimi K2.7 Code trực tiếp trong terminal hoặc IDE, cách đơn giản nhất là đăng ký Kimi Code.

ModeratoAllegrettoAllegroVivace
Giá hằng tháng$19 / tháng$39 / tháng$99 / tháng$199 / tháng
Mô tảHạn mức sử dụng được làm mới hằng tuần cùng đăng nhập đa thiết bị, cho phép bạn dùng chung gói trên nhiều thiết bị và làm việc hiệu quả với nhiều dự ánHạn mức hằng tuần rộng rãi và giới hạn đồng thời cao hơn, mang đến giải pháp giá trị cao cho người dùng nâng caoHạn mức lớn, được thiết kế cho hiệu suất vượt trội. Xử lý trơn tru mọi việc, từ tác vụ hằng ngày đến phát triển chuyên sâuCung cấp hạn mức hằng tuần cao nhất của chúng tôi, giúp bạn xử lý dễ dàng các dự án phức tạp và codebase lớn

Mỗi gói đều bao gồm hạn mức sử dụng được làm mới hằng tuần. Các hạng cao hơn có hạn mức hằng tuần lớn hơn và giới hạn đồng thời cao hơn, phù hợp với những dự án đòi hỏi nhiều hơn. Để xem thông tin gói mới nhất, hãy truy cập trang hội viên chính thức.

Ngoài Kimi Code còn có gì?

Mua bất kỳ gói Kimi Code nào cũng sẽ mở khóa các quyền lợi hội viên Kimi rộng hơn, chủ yếu được hỗ trợ bởi Kimi K2.6.

AdagioModeratoAllegrettoAllegroVivace
Giá$0$19 / tháng$39 / tháng$99 / tháng$199 / tháng
Mức sử dụng Agent660150360720
Tác vụ Agent đồng thời1 tác vụ2 tác vụ2 tác vụ4 tác vụ4 tác vụ
Hàng đợi ưu tiên AgentTốc độ 4xTốc độ 4xTốc độ 4xTốc độ 4x
Agent SwarmBao gồm 25 lượt dùngBao gồm 50 lượt dùngBao gồm 120 lượt dùngBao gồm 240 lượt dùng
Subagent đồng thời trong Agent Swarm2 subagent4 subagent4 subagent8 subagent
Kimi Claw
Kimi Claw Android
Kimi Claw PC
Trò chuyện nhóm với Claw10 cuộc trò chuyện nhóm10 cuộc trò chuyện nhóm10 cuộc trò chuyện nhóm
Triển khai website kèm cơ sở dữ liệu
Tác vụ đã lên lịch đang hoạt động của Kimi Work2 tác vụ10 tác vụ15 tác vụ20 tác vụ20 tác vụ

Các quyền lợi liên sản phẩm này có trong mọi hạng trả phí cùng với mức sử dụng Kimi K2.7 Code của bạn, mang đến cả một coding agent chuyên dụng lẫn không gian làm việc AI đầy đủ trong cùng một gói đăng ký.

Bảng giá Kimi K2.7 Code API

Bảng giá Kimi K2.7 Code API áp dụng mô hình dựa trên token, tính phí sử dụng theo mỗi 1 triệu token (1,000,000 token) cho cả xử lý đầu vào và đầu ra, giúp kiểm soát chi phí rõ ràng và dễ dự đoán.

Mô hìnhĐơn vịGiá đầu vào (cache hit)Giá đầu vào (cache miss)Giá đầu raCửa sổ ngữ cảnh
kimi-k2.7-code1 triệu token$0.19$0.95$4.00262,144 token
kimi-k2.7-code-highspeed1 triệu token$0.38$1.90$8.00262,144 token

Mô hình kimi-k2.7-code tiêu chuẩn mang lại hiệu năng lập trình thông minh nhất của Kimi, hỗ trợ đầy đủ suy luận ngữ cảnh dài và các tác vụ mang tính agent. Biến thể kimi-k2.7-code-highspeed cung cấp tốc độ đầu ra khoảng 180 token/giây (lên đến 260 token/giây trong các kịch bản ngữ cảnh ngắn), mang đến trải nghiệm lập trình cực nhanh cho những quy trình nhạy cảm với độ trễ.

Cơ chế tính phí Kimi K2.7 Code API

Kimi K2.7 Code API sử dụng mô hình định giá dựa trên token cho từng yêu cầu; mỗi lần tương tác với mô hình đều tiêu thụ token và được tính phí theo loại token. Trong mô hình này, token thường được chia thành ba loại: token đầu vào, token đầu ra và token đầu vào đã lưu cache.

Token đầu vào

Token đầu vào đại diện cho mọi nội dung được gửi tới mô hình, bao gồm:

  • Prompt của người dùng

  • Chỉ dẫn hệ thống

  • Lịch sử hội thoại hoặc ngữ cảnh

Các token này quyết định lượng ngữ cảnh mà mô hình cần xử lý trước khi tạo phản hồi.

Token đầu vào đã lưu cache

Token đầu vào đã lưu cache phát sinh khi ngữ cảnh đã xử lý trước đó được tái sử dụng.

  • Nếu cùng một ngữ cảnh hoặc ngữ cảnh tương tự được tái sử dụng, chi phí có thể thấp hơn

  • Điều này cải thiện đáng kể hiệu quả cho các quy trình lặp lại

  • Đặc biệt hữu ích trong các ứng dụng ngữ cảnh dài hoặc tương tác nhiều lượt

Token đầu ra

Token đầu ra được mô hình tạo ra để phản hồi một yêu cầu. Chúng là nội dung thực tế do AI tạo, chẳng hạn như:

  • Sinh mã

  • Phản hồi văn bản

  • Đầu ra có cấu trúc

Vì việc tạo đầu ra đòi hỏi thêm tài nguyên tính toán, token đầu ra thường có giá cao hơn token đầu vào.

Kết luận

Kimi K2.7 Code mang đến cấu trúc giá minh bạch, linh hoạt, phù hợp từ dự án phát triển cá nhân đến khối lượng công việc sản xuất quy mô lớn. Với cách tính phí dựa trên token, ưu đãi cache và tùy chọn mô hình tốc độ cao, nhà phát triển có thể cân bằng hiệu năng và chi phí theo nhu cầu cụ thể. Nhờ đó, việc xây dựng, thử nghiệm và triển khai các quy trình lập trình dùng AI trở nên dễ dàng hơn mà vẫn giữ được mức chi tiêu dễ dự đoán.

Câu hỏi thường gặp

Cách tính phí Kimi K2.7 Code API như thế nào?
Kimi K2.7 Code API tính phí theo từng token. Mỗi yêu cầu sẽ tiêu thụ token đầu vào (prompt của bạn cùng ngữ cảnh) và token đầu ra (phản hồi do mô hình tạo ra). Token đầu vào được tính phí $0.95 cho mỗi 1 triệu token khi cache miss, hoặc $0.19 cho mỗi 1 triệu token khi cache hit. Token đầu ra được tính phí $4.00 cho mỗi 1 triệu token với mô hình tiêu chuẩn, và $8.00 cho mỗi 1 triệu token với biến thể tốc độ cao. Tất cả mức giá chưa bao gồm các loại thuế áp dụng.
Tôi có thể tiết kiệm bao nhiêu nhờ cache ngữ cảnh?
Khi ngữ cảnh đã xử lý trước đó được tái sử dụng, token đầu vào đã lưu cache được tính phí $0.19 cho mỗi 1 triệu token thay vì $0.95 — giảm 80% chi phí đầu vào cho ngữ cảnh lặp lại. Nhờ vậy, cache đặc biệt hiệu quả cho các phiên lập trình nhiều lượt kéo dài, quy trình gỡ lỗi lặp lại và mọi tình huống thường xuyên gửi lại prompt hoặc ngữ cảnh codebase tương tự.
Tôi nên dùng API hay gói hội viên Kimi?
Hãy dùng API nếu bạn đang xây dựng công cụ tùy chỉnh, pipeline CI/CD hoặc nền tảng nhà phát triển nội bộ cần truy cập theo chương trình và kiểm soát chi tiết mức tiêu thụ token. Hãy chọn gói hội viên Kimi (từ $19/tháng) nếu bạn muốn truy cập ngay qua Kimi Code trong terminal và IDE mà không phải quản lý API key hay ước tính lượng token sử dụng. Các gói hội viên bao gồm tín dụng Kimi Code được làm mới hằng tuần; các hạng cao hơn mở khóa nhiều tín dụng hơn và mức đồng thời cao hơn.
Bảng giá Kimi K2.7 Code API có phù hợp cho nhu cầu quy mô doanh nghiệp không?
Có. Mô hình dựa trên token có thể mở rộng từ nhà phát triển cá nhân đến triển khai cấp doanh nghiệp mà không giới hạn mức sử dụng tối đa. Với các kịch bản khối lượng lớn, cơ chế cache ngữ cảnh tự động giúp giảm đáng kể chi phí khi các đầu vào tương tự được tái sử dụng giữa các phiên. Nếu bạn cần điều khoản doanh nghiệp tùy chỉnh, hỗ trợ riêng hoặc chiết khấu theo sản lượng, hãy liên hệ đội ngũ kinh doanh Kimi qua Kimi API Platform.
Bảng giá Kimi K2.7 Code | Chi phí API, gói dịch vụ & thành viên