Giá Kimi K2.6 cho API và gói thành viên

8 phút đọc2026-06-17

Kimi K2.6 là mô hình mã nguồn mở với năng lực lập trình tiên tiến, thực thi dài hạn và khả năng agent swarm. Dưới đây là tổng quan về giá Kimi API và các gói thành viên Kimi.

Tổng quan giá Kimi K2.6 API

Giá Kimi K2.6 API sử dụng mô hình dựa trên token, với mức sử dụng được tính phí theo 1M tokens (1.000.000 tokens) cho cả xử lý đầu vào và đầu ra, giúp kiểm soát chi phí rõ ràng và dễ dự báo.

Mô hìnhĐơn vịGiá đầu vào (Cache Hit)Giá đầu vào (Cache Miss)Giá đầu raCửa sổ ngữ cảnh
kimi-k2.61M tokens$0.16$0.95$4.00262,144 tokens

Mô hình giá Kimi K2.6 API

Kimi K2.6 API sử dụng mô hình giá dựa trên token cho từng yêu cầu; mỗi lần tương tác với mô hình đều tiêu thụ token và được tính phí theo loại token. Trong mô hình này, token thường được chia thành ba loại: token đầu vào, token đầu ra và token đầu vào được lưu trong bộ nhớ đệm.

Token đầu vào

Token đầu vào đại diện cho mọi nội dung được gửi tới mô hình, bao gồm:

  • Prompt của người dùng

  • Chỉ dẫn hệ thống

  • Lịch sử hội thoại hoặc ngữ cảnh

Những token này quyết định lượng ngữ cảnh mà mô hình cần xử lý trước khi tạo phản hồi.

Token đầu ra

Token đầu ra do mô hình tạo ra để đáp lại một yêu cầu. Chúng đại diện cho nội dung thực tế do AI tạo, chẳng hạn như:

  • Phản hồi văn bản

  • Tạo mã

  • Đầu ra có cấu trúc

Vì việc tạo đầu ra cần thêm tài nguyên tính toán, token đầu ra thường có giá cao hơn token đầu vào.

Token đầu vào được lưu trong bộ nhớ đệm

Token đầu vào được lưu trong bộ nhớ đệm xuất hiện khi ngữ cảnh đã xử lý trước đó được tái sử dụng.

  • Nếu cùng một ngữ cảnh hoặc ngữ cảnh tương tự được tái sử dụng, chi phí có thể được giảm

  • Điều này cải thiện đáng kể hiệu quả cho các quy trình lặp lại

  • Đặc biệt hữu ích trong các ứng dụng ngữ cảnh dài hoặc tương tác nhiều lượt

Ghi chú về giá Kimi K2.6 API

Giá Kimi K2.6 API tuân theo mô hình minh bạch, dựa trên mức tiêu thụ; dưới đây là một vài chi tiết quan trọng giúp nhà phát triển hiểu rõ hơn về cách tính phí và biến động chi phí.

Chính sách thuế và thanh toán

Tất cả mức giá niêm yết cho Kimi K2.6 API chưa bao gồm các khoản thuế áp dụng. Thuế được tự động tính khi thanh toán dựa trên khu vực lập hóa đơn của người dùng và quy định thuế địa phương, bảo đảm mỗi đơn hàng được lập hóa đơn chính xác và tuân thủ.

Giải thích về lượng token sử dụng

Để giá Kimi K2.6 API dễ hiểu hơn, việc tính phí được áp dụng theo một chuẩn token nhất quán:

  • 1M tokens = 1,000,000 tokens

  • Token đầu vào bao gồm prompt và thông tin ngữ cảnh

  • Token đầu ra là các phản hồi do mô hình tạo ra

Cấu trúc này giúp ước tính chi phí minh bạch và dễ dự báo cho mọi yêu cầu Kimi API.

Tối ưu chi phí nhờ bộ nhớ đệm

Kimi K2.6 cũng có cơ chế lưu bộ nhớ đệm giúp tối ưu chi phí sử dụng. Khi làm việc với các đầu vào lặp lại hoặc tương tự nhau, token đầu vào được lưu trong bộ nhớ đệm sẽ được tính phí thấp hơn, qua đó giảm tổng mức tiêu thụ theo mô hình giá Kimi API.

  • Token đầu vào được lưu trong bộ nhớ đệm được tính theo mức giá ưu đãi

  • Ngữ cảnh được tái sử dụng giúp giảm tổng lượng token tiêu thụ

  • Nâng cao hiệu quả cho các phiên dài và quy trình lặp lại

Nhờ vậy, giá Kimi K2.6 API trở nên tiết kiệm hơn trong các kịch bản production, nơi prompt hoặc ngữ cảnh thường xuyên được tái sử dụng.

Dù không có gói Kimi API miễn phí vĩnh viễn cho mục đích production, mô hình giá vẫn được thiết kế linh hoạt và có khả năng mở rộng, cho phép nhà phát triển kiểm soát chi phí dựa trên lượng token tiêu thụ thực tế.

Gói giá và cấp sử dụng cho Kimi K2.6

Ngoài mức giá sử dụng theo API, Kimi còn cung cấp các gói thành viên theo cấp, mở rộng theo nhu cầu của bạn, giúp dễ dàng chọn đúng cấp độ cho quy trình làm việc. Các gói này cho phép người dùng chọn cấp phù hợp nhất dựa trên nhu cầu sử dụng hằng ngày và yêu cầu mở rộng.

Tính năngAdagioModeratoAllegrettoAllegroVivace
Thanh toán hằng năm (quy đổi theo tháng)$0 / tháng$15 / tháng$31 / tháng$79 / tháng$159 / tháng
Mức sử dụng Agent660150360720
Tác vụ đồng thời1 tác vụ2 tác vụ2 tác vụ4 tác vụ4 tác vụ
Hàng đợi ưu tiên Agent×tốc độ 4×tốc độ 4×tốc độ 4×tốc độ 4×
Agent Swarm××Bao gồm 50 lượt sử dụngBao gồm 120 lượt sử dụngBao gồm 240 lượt sử dụng
Subagent đồng thời××4 subagent4 subagent8 subagent
Kimi Code×1× credit5× credit15× credit30× credit
Kimi Claw××
Kimi Claw Android××
Kimi Claw (Mac ARM / PC)××
Trò chuyện nhóm với Claw××10 cuộc trò chuyện10 cuộc trò chuyện10 cuộc trò chuyện
Yêu cầu dữ liệu chuyên nghiệp200200050001200024000
Triển khai website với cơ sở dữ liệu×

Kết luận

Kimi K2.6 cung cấp mức giá linh hoạt cho cả nhà phát triển lẫn người dùng hằng ngày. Cách tính phí API theo token giúp chi phí minh bạch, dễ dự báo, đồng thời hỗ trợ bộ nhớ đệm để giảm chi phí trong các quy trình có lưu lượng lớn hoặc ngữ cảnh dài. Với những ai muốn quyền truy cập theo cấu trúc rõ ràng, các gói thành viên theo cấp có thể mở rộng từ miễn phí đến nhu cầu chuyên nghiệp, bao gồm năng lực agent, tác vụ đồng thời và các công cụ như Kimi Claw và Agent Swarm. Dù bạn tích hợp qua API hay khám phá trọn bộ tính năng của Kimi, luôn có một gói được thiết kế phù hợp với quy trình làm việc và ngân sách của bạn.

Câu hỏi thường gặp

Giá Kimi K2.6 API được tính như thế nào?
Giá Kimi K2.6 API được tính dựa trên lượng token sử dụng, bao gồm token đầu vào, token đầu ra và token đầu vào được lưu trong bộ nhớ đệm. Mọi mức sử dụng đều được tính phí theo 1M tokens (1.000.000 tokens), giúp chi phí Kimi API dễ đo lường và dự báo trên nhiều loại khối lượng công việc.
Yếu tố nào ảnh hưởng nhiều nhất đến tổng chi phí API?
Các yếu tố chính quyết định chi phí là lượng token đầu ra, độ dài prompt và kích thước ngữ cảnh. Trong hầu hết trường hợp, phản hồi dài hơn và đầu vào lớn hơn sẽ làm tăng tổng mức sử dụng theo mô hình giá K2.6 API.
Kimi K2.6 API có rẻ hơn khi dùng token được lưu trong bộ nhớ đệm không?
Có. Token đầu vào được lưu trong bộ nhớ đệm được tính phí thấp hơn vì có thể tái sử dụng ngữ cảnh đã xử lý trước đó. Nhờ vậy, giá Kimi API hiệu quả hơn cho các yêu cầu lặp lại hoặc tương tự nhau.
Kimi K2.6 hỗ trợ bao nhiêu token cho mỗi yêu cầu?
Mô hình hỗ trợ cửa sổ ngữ cảnh tối đa 256K tokens, cho phép xử lý tài liệu dài, cuộc trò chuyện kéo dài và các tác vụ nhiều bước phức tạp trong một yêu cầu duy nhất.
Điều gì xảy ra nếu đầu vào của tôi vượt quá cửa sổ ngữ cảnh?
Kimi K2.6 hỗ trợ tối đa 256K tokens cho mỗi yêu cầu. Nếu đầu vào vượt quá giới hạn này, cần chia nhỏ hoặc rút ngắn trước khi xử lý qua Kimi API.
Kimi K2.6 có hỗ trợ mức sử dụng khối lượng lớn hoặc quy mô doanh nghiệp không?
Có. Kimi K2.6 được thiết kế cho các khối lượng công việc có khả năng mở rộng, hỗ trợ cả ứng dụng nhẹ lẫn kịch bản doanh nghiệp thông lượng cao với mức giá dựa trên token dễ dự báo.
Kimi K2.6 API có phí ẩn không?
Không. Mô hình giá Kimi API hoàn toàn minh bạch và chỉ dựa trên lượng token sử dụng. Không có phí nền tảng ẩn, dù thuế có thể được áp dụng tùy theo khu vực của người dùng.