Giải thích bảng giá Kimi K2.7 Code: chi phí và gói API

Q: Cách tính phí Kimi K2.7 Code API như thế nào?

Kimi K2\.7 Code API tính phí theo từng token\. Mỗi yêu cầu sẽ tiêu thụ token đầu vào $prompt của bạn cùng ngữ cảnh$ và token đầu ra $phản hồi do mô hình tạo ra$\. Token đầu vào được tính phí \$0\.95 cho mỗi 1 triệu token khi cache miss, hoặc \$0\.19 cho mỗi 1 triệu token khi cache hit\. Token đầu ra được tính phí \$4\.00 cho mỗi 1 triệu token với mô hình tiêu chuẩn, và \$8\.00 cho mỗi 1 triệu token với biến thể tốc độ cao\. Tất cả mức giá chưa bao gồm các loại thuế áp dụng\.

Q: Bảng giá Kimi K2.7 Code API có phù hợp cho nhu cầu quy mô doanh nghiệp không?

Có\. Mô hình dựa trên token có thể mở rộng từ nhà phát triển cá nhân đến triển khai cấp doanh nghiệp mà không giới hạn mức sử dụng tối đa\. Với các kịch bản khối lượng lớn, cơ chế cache ngữ cảnh tự động giúp giảm đáng kể chi phí khi các đầu vào tương tự được tái sử dụng giữa các phiên\. Nếu bạn cần điều khoản doanh nghiệp tùy chỉnh, hỗ trợ riêng hoặc chiết khấu theo sản lượng, hãy liên hệ đội ngũ kinh doanh Kimi qua Kimi API Platform\.

Đăng ký ngay

8 phút đọc2026-06-25

Các gói hội viên & hạng mức sử dụng Kimi K2.7 Code

Nếu muốn dùng Kimi K2.7 Code trực tiếp trong terminal hoặc IDE, cách đơn giản nhất là đăng ký Kimi Code.

	Moderato	Allegretto	Allegro	Vivace
Giá hằng tháng	$19 / tháng	$39 / tháng	$99 / tháng	$199 / tháng
Mô tả	Hạn mức sử dụng được làm mới hằng tuần cùng đăng nhập đa thiết bị, cho phép bạn dùng chung gói trên nhiều thiết bị và làm việc hiệu quả với nhiều dự án	Hạn mức hằng tuần rộng rãi và giới hạn đồng thời cao hơn, mang đến giải pháp giá trị cao cho người dùng nâng cao	Hạn mức lớn, được thiết kế cho hiệu suất vượt trội. Xử lý trơn tru mọi việc, từ tác vụ hằng ngày đến phát triển chuyên sâu	Cung cấp hạn mức hằng tuần cao nhất của chúng tôi, giúp bạn xử lý dễ dàng các dự án phức tạp và codebase lớn

Mỗi gói đều bao gồm hạn mức sử dụng được làm mới hằng tuần. Các hạng cao hơn có hạn mức hằng tuần lớn hơn và giới hạn đồng thời cao hơn, phù hợp với những dự án đòi hỏi nhiều hơn. Để xem thông tin gói mới nhất, hãy truy cập trang hội viên chính thức.

Đăng ký ngay

Ngoài Kimi Code còn có gì?

Mua bất kỳ gói Kimi Code nào cũng sẽ mở khóa các quyền lợi hội viên Kimi rộng hơn, chủ yếu được hỗ trợ bởi Kimi K2.6.

	Adagio	Moderato	Allegretto	Allegro	Vivace
Giá	$0	$19 / tháng	$39 / tháng	$99 / tháng	$199 / tháng
Mức sử dụng Agent	6	60	150	360	720
Tác vụ Agent đồng thời	1 tác vụ	2 tác vụ	2 tác vụ	4 tác vụ	4 tác vụ
Hàng đợi ưu tiên Agent	✗	Tốc độ 4x	Tốc độ 4x	Tốc độ 4x	Tốc độ 4x
Agent Swarm	✗	Bao gồm 25 lượt dùng	Bao gồm 50 lượt dùng	Bao gồm 120 lượt dùng	Bao gồm 240 lượt dùng
Subagent đồng thời trong Agent Swarm	✗	2 subagent	4 subagent	4 subagent	8 subagent
Kimi Claw	✗	✗	✓	✓	✓
Kimi Claw Android	✗	✗	✓	✓	✓
Kimi Claw PC	✗	✗	✓	✓	✓
Trò chuyện nhóm với Claw	✗	✗	10 cuộc trò chuyện nhóm	10 cuộc trò chuyện nhóm	10 cuộc trò chuyện nhóm
Triển khai website kèm cơ sở dữ liệu	✗	✓	✓	✓	✓
Tác vụ đã lên lịch đang hoạt động của Kimi Work	2 tác vụ	10 tác vụ	15 tác vụ	20 tác vụ	20 tác vụ

Các quyền lợi liên sản phẩm này có trong mọi hạng trả phí cùng với mức sử dụng Kimi K2.7 Code của bạn, mang đến cả một coding agent chuyên dụng lẫn không gian làm việc AI đầy đủ trong cùng một gói đăng ký.

Đăng ký ngay

Bảng giá Kimi K2.7 Code API

Bảng giá Kimi K2.7 Code API áp dụng mô hình dựa trên token, tính phí sử dụng theo mỗi 1 triệu token (1,000,000 token) cho cả xử lý đầu vào và đầu ra, giúp kiểm soát chi phí rõ ràng và dễ dự đoán.

Mô hình	Đơn vị	Giá đầu vào (cache hit)	Giá đầu vào (cache miss)	Giá đầu ra	Cửa sổ ngữ cảnh
kimi-k2.7-code	1 triệu token	$0.19	$0.95	$4.00	262,144 token
kimi-k2.7-code-highspeed	1 triệu token	$0.38	$1.90	$8.00	262,144 token

Mô hình kimi-k2.7-code tiêu chuẩn mang lại hiệu năng lập trình thông minh nhất của Kimi, hỗ trợ đầy đủ suy luận ngữ cảnh dài và các tác vụ mang tính agent. Biến thể kimi-k2.7-code-highspeed cung cấp tốc độ đầu ra khoảng 180 token/giây (lên đến 260 token/giây trong các kịch bản ngữ cảnh ngắn), mang đến trải nghiệm lập trình cực nhanh cho những quy trình nhạy cảm với độ trễ.

Nhận tín dụng API

Cơ chế tính phí Kimi K2.7 Code API

Kimi K2.7 Code API sử dụng mô hình định giá dựa trên token cho từng yêu cầu; mỗi lần tương tác với mô hình đều tiêu thụ token và được tính phí theo loại token. Trong mô hình này, token thường được chia thành ba loại: token đầu vào, token đầu ra và token đầu vào đã lưu cache.

Token đầu vào

Token đầu vào đại diện cho mọi nội dung được gửi tới mô hình, bao gồm:

Prompt của người dùng
Chỉ dẫn hệ thống
Lịch sử hội thoại hoặc ngữ cảnh

Các token này quyết định lượng ngữ cảnh mà mô hình cần xử lý trước khi tạo phản hồi.

Token đầu vào đã lưu cache

Token đầu vào đã lưu cache phát sinh khi ngữ cảnh đã xử lý trước đó được tái sử dụng.

Nếu cùng một ngữ cảnh hoặc ngữ cảnh tương tự được tái sử dụng, chi phí có thể thấp hơn
Điều này cải thiện đáng kể hiệu quả cho các quy trình lặp lại
Đặc biệt hữu ích trong các ứng dụng ngữ cảnh dài hoặc tương tác nhiều lượt

Token đầu ra

Token đầu ra được mô hình tạo ra để phản hồi một yêu cầu. Chúng là nội dung thực tế do AI tạo, chẳng hạn như:

Sinh mã
Phản hồi văn bản
Đầu ra có cấu trúc

Vì việc tạo đầu ra đòi hỏi thêm tài nguyên tính toán, token đầu ra thường có giá cao hơn token đầu vào.

Nhận tín dụng API

Kết luận

Kimi K2.7 Code mang đến cấu trúc giá minh bạch, linh hoạt, phù hợp từ dự án phát triển cá nhân đến khối lượng công việc sản xuất quy mô lớn. Với cách tính phí dựa trên token, ưu đãi cache và tùy chọn mô hình tốc độ cao, nhà phát triển có thể cân bằng hiệu năng và chi phí theo nhu cầu cụ thể. Nhờ đó, việc xây dựng, thử nghiệm và triển khai các quy trình lập trình dùng AI trở nên dễ dàng hơn mà vẫn giữ được mức chi tiêu dễ dự đoán.

Câu hỏi thường gặp

Cách tính phí Kimi K2.7 Code API như thế nào?

Kimi K2.7 Code API tính phí theo từng token. Mỗi yêu cầu sẽ tiêu thụ token đầu vào (prompt của bạn cùng ngữ cảnh) và token đầu ra (phản hồi do mô hình tạo ra). Token đầu vào được tính phí $0.95 cho mỗi 1 triệu token khi cache miss, hoặc $0.19 cho mỗi 1 triệu token khi cache hit. Token đầu ra được tính phí $4.00 cho mỗi 1 triệu token với mô hình tiêu chuẩn, và $8.00 cho mỗi 1 triệu token với biến thể tốc độ cao. Tất cả mức giá chưa bao gồm các loại thuế áp dụng.

Tôi có thể tiết kiệm bao nhiêu nhờ cache ngữ cảnh?

Khi ngữ cảnh đã xử lý trước đó được tái sử dụng, token đầu vào đã lưu cache được tính phí $0.19 cho mỗi 1 triệu token thay vì $0.95 — giảm 80% chi phí đầu vào cho ngữ cảnh lặp lại. Nhờ vậy, cache đặc biệt hiệu quả cho các phiên lập trình nhiều lượt kéo dài, quy trình gỡ lỗi lặp lại và mọi tình huống thường xuyên gửi lại prompt hoặc ngữ cảnh codebase tương tự.

Tôi nên dùng API hay gói hội viên Kimi?

Hãy dùng API nếu bạn đang xây dựng công cụ tùy chỉnh, pipeline CI/CD hoặc nền tảng nhà phát triển nội bộ cần truy cập theo chương trình và kiểm soát chi tiết mức tiêu thụ token. Hãy chọn gói hội viên Kimi (từ $19/tháng) nếu bạn muốn truy cập ngay qua Kimi Code trong terminal và IDE mà không phải quản lý API key hay ước tính lượng token sử dụng. Các gói hội viên bao gồm tín dụng Kimi Code được làm mới hằng tuần; các hạng cao hơn mở khóa nhiều tín dụng hơn và mức đồng thời cao hơn.

Bảng giá Kimi K2.7 Code API có phù hợp cho nhu cầu quy mô doanh nghiệp không?

Có. Mô hình dựa trên token có thể mở rộng từ nhà phát triển cá nhân đến triển khai cấp doanh nghiệp mà không giới hạn mức sử dụng tối đa. Với các kịch bản khối lượng lớn, cơ chế cache ngữ cảnh tự động giúp giảm đáng kể chi phí khi các đầu vào tương tự được tái sử dụng giữa các phiên. Nếu bạn cần điều khoản doanh nghiệp tùy chỉnh, hỗ trợ riêng hoặc chiết khấu theo sản lượng, hãy liên hệ đội ngũ kinh doanh Kimi qua Kimi API Platform.

Có thể bạn cũng sẽ thích

Kimi Code: AI Code Agent thế hệ mới cho Terminal & IDE

2026-06-22

Tái cấu trúc Moonshot AI với Kimi Code CLI

2026-06-17

10 ví dụ lập trình vibe thực tế | Xây dựng bằng AI ngay hôm nay

2026-06-17

Tra cứu nhanh Kimi Code CLI: Lệnh, phím tắt và quy trình

2026-06-22