Kimi K2.6 là mô hình mã nguồn mở với năng lực lập trình tiên tiến, thực thi dài hạn và khả năng agent swarm. Dưới đây là tổng quan về giá Kimi API và các gói thành viên Kimi.
Tổng quan giá Kimi K2.6 API
Giá Kimi K2.6 API sử dụng mô hình dựa trên token, với mức sử dụng được tính phí theo 1M tokens (1.000.000 tokens) cho cả xử lý đầu vào và đầu ra, giúp kiểm soát chi phí rõ ràng và dễ dự báo.
| Mô hình | Đơn vị | Giá đầu vào (Cache Hit) | Giá đầu vào (Cache Miss) | Giá đầu ra | Cửa sổ ngữ cảnh |
|---|---|---|---|---|---|
| kimi-k2.6 | 1M tokens | $0.16 | $0.95 | $4.00 | 262,144 tokens |
Mô hình giá Kimi K2.6 API
Kimi K2.6 API sử dụng mô hình giá dựa trên token cho từng yêu cầu; mỗi lần tương tác với mô hình đều tiêu thụ token và được tính phí theo loại token. Trong mô hình này, token thường được chia thành ba loại: token đầu vào, token đầu ra và token đầu vào được lưu trong bộ nhớ đệm.
Token đầu vào
Token đầu vào đại diện cho mọi nội dung được gửi tới mô hình, bao gồm:
Prompt của người dùng
Chỉ dẫn hệ thống
Lịch sử hội thoại hoặc ngữ cảnh
Những token này quyết định lượng ngữ cảnh mà mô hình cần xử lý trước khi tạo phản hồi.
Token đầu ra
Token đầu ra do mô hình tạo ra để đáp lại một yêu cầu. Chúng đại diện cho nội dung thực tế do AI tạo, chẳng hạn như:
Phản hồi văn bản
Tạo mã
Đầu ra có cấu trúc
Vì việc tạo đầu ra cần thêm tài nguyên tính toán, token đầu ra thường có giá cao hơn token đầu vào.
Token đầu vào được lưu trong bộ nhớ đệm
Token đầu vào được lưu trong bộ nhớ đệm xuất hiện khi ngữ cảnh đã xử lý trước đó được tái sử dụng.
Nếu cùng một ngữ cảnh hoặc ngữ cảnh tương tự được tái sử dụng, chi phí có thể được giảm
Điều này cải thiện đáng kể hiệu quả cho các quy trình lặp lại
Đặc biệt hữu ích trong các ứng dụng ngữ cảnh dài hoặc tương tác nhiều lượt
Ghi chú về giá Kimi K2.6 API
Giá Kimi K2.6 API tuân theo mô hình minh bạch, dựa trên mức tiêu thụ; dưới đây là một vài chi tiết quan trọng giúp nhà phát triển hiểu rõ hơn về cách tính phí và biến động chi phí.
Chính sách thuế và thanh toán
Tất cả mức giá niêm yết cho Kimi K2.6 API chưa bao gồm các khoản thuế áp dụng. Thuế được tự động tính khi thanh toán dựa trên khu vực lập hóa đơn của người dùng và quy định thuế địa phương, bảo đảm mỗi đơn hàng được lập hóa đơn chính xác và tuân thủ.
Giải thích về lượng token sử dụng
Để giá Kimi K2.6 API dễ hiểu hơn, việc tính phí được áp dụng theo một chuẩn token nhất quán:
1M tokens = 1,000,000 tokens
Token đầu vào bao gồm prompt và thông tin ngữ cảnh
Token đầu ra là các phản hồi do mô hình tạo ra
Cấu trúc này giúp ước tính chi phí minh bạch và dễ dự báo cho mọi yêu cầu Kimi API.
Tối ưu chi phí nhờ bộ nhớ đệm
Kimi K2.6 cũng có cơ chế lưu bộ nhớ đệm giúp tối ưu chi phí sử dụng. Khi làm việc với các đầu vào lặp lại hoặc tương tự nhau, token đầu vào được lưu trong bộ nhớ đệm sẽ được tính phí thấp hơn, qua đó giảm tổng mức tiêu thụ theo mô hình giá Kimi API.
Token đầu vào được lưu trong bộ nhớ đệm được tính theo mức giá ưu đãi
Ngữ cảnh được tái sử dụng giúp giảm tổng lượng token tiêu thụ
Nâng cao hiệu quả cho các phiên dài và quy trình lặp lại
Nhờ vậy, giá Kimi K2.6 API trở nên tiết kiệm hơn trong các kịch bản production, nơi prompt hoặc ngữ cảnh thường xuyên được tái sử dụng.
Dù không có gói Kimi API miễn phí vĩnh viễn cho mục đích production, mô hình giá vẫn được thiết kế linh hoạt và có khả năng mở rộng, cho phép nhà phát triển kiểm soát chi phí dựa trên lượng token tiêu thụ thực tế.
Gói giá và cấp sử dụng cho Kimi K2.6
Ngoài mức giá sử dụng theo API, Kimi còn cung cấp các gói thành viên theo cấp, mở rộng theo nhu cầu của bạn, giúp dễ dàng chọn đúng cấp độ cho quy trình làm việc. Các gói này cho phép người dùng chọn cấp phù hợp nhất dựa trên nhu cầu sử dụng hằng ngày và yêu cầu mở rộng.
| Tính năng | Adagio | Moderato | Allegretto | Allegro | Vivace |
|---|---|---|---|---|---|
| Thanh toán hằng năm (quy đổi theo tháng) | $0 / tháng | $15 / tháng | $31 / tháng | $79 / tháng | $159 / tháng |
| Mức sử dụng Agent | 6 | 60 | 150 | 360 | 720 |
| Tác vụ đồng thời | 1 tác vụ | 2 tác vụ | 2 tác vụ | 4 tác vụ | 4 tác vụ |
| Hàng đợi ưu tiên Agent | × | tốc độ 4× | tốc độ 4× | tốc độ 4× | tốc độ 4× |
| Agent Swarm | × | × | Bao gồm 50 lượt sử dụng | Bao gồm 120 lượt sử dụng | Bao gồm 240 lượt sử dụng |
| Subagent đồng thời | × | × | 4 subagent | 4 subagent | 8 subagent |
| Kimi Code | × | 1× credit | 5× credit | 15× credit | 30× credit |
| Kimi Claw | × | × | ✓ | ✓ | ✓ |
| Kimi Claw Android | × | × | ✓ | ✓ | ✓ |
| Kimi Claw (Mac ARM / PC) | × | × | ✓ | ✓ | ✓ |
| Trò chuyện nhóm với Claw | × | × | 10 cuộc trò chuyện | 10 cuộc trò chuyện | 10 cuộc trò chuyện |
| Yêu cầu dữ liệu chuyên nghiệp | 200 | 2000 | 5000 | 12000 | 24000 |
| Triển khai website với cơ sở dữ liệu | × | ✓ | ✓ | ✓ | ✓ |
Kết luận
Kimi K2.6 cung cấp mức giá linh hoạt cho cả nhà phát triển lẫn người dùng hằng ngày. Cách tính phí API theo token giúp chi phí minh bạch, dễ dự báo, đồng thời hỗ trợ bộ nhớ đệm để giảm chi phí trong các quy trình có lưu lượng lớn hoặc ngữ cảnh dài. Với những ai muốn quyền truy cập theo cấu trúc rõ ràng, các gói thành viên theo cấp có thể mở rộng từ miễn phí đến nhu cầu chuyên nghiệp, bao gồm năng lực agent, tác vụ đồng thời và các công cụ như Kimi Claw và Agent Swarm. Dù bạn tích hợp qua API hay khám phá trọn bộ tính năng của Kimi, luôn có một gói được thiết kế phù hợp với quy trình làm việc và ngân sách của bạn.