Kimi K2.7 Code 요금 안내: API 비용 및 플랜

8분 읽기2026-06-25
Kimi K2.7 Code API 요금

Kimi K2.7 Code 멤버십 플랜 및 사용 티어

터미널이나 IDE에서 Kimi K2.7 Code를 직접 사용하고 싶다면 Kimi Code 구독이 가장 간단한 방법입니다.

ModeratoAllegrettoAllegroVivace
월간 요금월 $19월 $39월 $99월 $199
설명매주 새로 제공되는 사용 할당량과 멀티 디바이스 로그인을 지원해, 여러 기기에서 플랜을 공유하고 여러 프로젝트를 효율적으로 진행할 수 있습니다넉넉한 주간 한도와 향상된 동시 실행 한도로, 고급 사용자에게 뛰어난 가치를 제공하는 솔루션입니다탁월한 성능을 위해 설계된 넓은 할당량. 일상 업무부터 고강도 개발까지 매끄럽게 처리합니다가장 높은 주간 플랜 할당량을 제공해, 복잡한 프로젝트와 대규모 코드베이스도 여유 있게 다룰 수 있습니다

각 플랜에는 매주 새로 제공되는 사용 할당량이 포함됩니다. 상위 티어일수록 주간 한도와 동시 실행 한도가 높아져 더 까다로운 프로젝트에 적합합니다. 최신 플랜 정보는 공식 멤버십 페이지를 확인하세요.

Kimi Code 외에 무엇이 포함되나요?

Kimi Code 플랜을 구매하면 Kimi K2.6을 주축으로 제공되는 더 폭넓은 Kimi 멤버십 혜택도 함께 이용할 수 있습니다.

AdagioModeratoAllegrettoAllegroVivace
가격$0월 $19월 $39월 $99월 $199
Agent 사용량660150360720
Agent 동시 작업작업 1개작업 2개작업 2개작업 4개작업 4개
Agent 우선 대기열4배 속도4배 속도4배 속도4배 속도
Agent Swarm25회 사용 포함50회 사용 포함120회 사용 포함240회 사용 포함
Agent Swarm 동시 하위 agent하위 agent 2개하위 agent 4개하위 agent 4개하위 agent 8개
Kimi Claw
Kimi Claw Android
Kimi Claw PC
Claw와 그룹 채팅그룹 채팅 10개그룹 채팅 10개그룹 채팅 10개
데이터베이스가 포함된 웹사이트 배포
Kimi Work 활성 예약 작업작업 2개작업 10개작업 15개작업 20개작업 20개

이러한 제품 간 혜택은 Kimi K2.7 Code 사용과 함께 모든 유료 티어에서 제공되며, 하나의 구독으로 전용 코딩 agent와 완전한 AI 워크스페이스를 모두 이용할 수 있습니다.

Kimi K2.7 Code API 요금

Kimi K2.7 Code API 요금은 token 기반 모델을 사용하며, 입력과 출력 처리 모두 100만 token(1,000,000 tokens) 단위로 사용량이 과금되어 비용을 명확하고 예측 가능하게 관리할 수 있습니다.

모델단위입력 가격 (캐시 히트)입력 가격 (캐시 미스)출력 가격컨텍스트 창
kimi-k2.7-code100만 tokens$0.19$0.95$4.00262,144 tokens
kimi-k2.7-code-highspeed100만 tokens$0.38$1.90$8.00262,144 tokens

표준 kimi-k2.7-code 모델은 긴 컨텍스트 추론과 agentic 작업을 완벽하게 지원하며 Kimi의 가장 지능적인 코딩 성능을 제공합니다. kimi-k2.7-code-highspeed 변형 모델은 약 180 Tokens/s의 출력 속도(짧은 컨텍스트 시나리오에서는 최대 260 Tokens/s)를 제공하여, 지연 시간에 민감한 워크플로에 극한의 코딩 경험을 선사합니다.

Kimi K2.7 Code API 과금 방식

Kimi K2.7 Code API는 각 요청에 token 기반 가격 모델을 적용하며, 모델과의 모든 상호작용에서 소비되는 tokens는 유형에 따라 과금됩니다. 이 모델에서 tokens는 일반적으로 입력 tokens, 출력 tokens, 캐시된 입력 tokens의 세 가지 유형으로 분류됩니다.

입력 tokens

입력 tokens는 모델로 전송되는 모든 내용을 의미하며, 여기에는 다음이 포함됩니다:

  • 사용자 프롬프트

  • 시스템 지침

  • 대화 기록 또는 컨텍스트

이 tokens는 모델이 응답을 생성하기 전에 처리해야 할 컨텍스트의 양을 결정합니다.

캐시된 입력 tokens

캐시된 입력 tokens는 이전에 처리한 컨텍스트를 재사용할 때 발생합니다.

  • 동일하거나 유사한 컨텍스트를 재사용하면 더 낮은 비용으로 처리할 수 있습니다

  • 반복적인 워크플로의 효율이 크게 높아집니다

  • 긴 컨텍스트 애플리케이션이나 다중 턴 상호작용에서 특히 유용합니다

출력 tokens

출력 tokens는 요청에 대한 응답으로 모델이 생성하는 tokens입니다. 실제 AI 생성 콘텐츠를 의미하며, 예를 들면 다음과 같습니다:

  • 코드 생성

  • 텍스트 응답

  • 구조화된 출력

출력 생성에는 추가 연산이 필요하므로 일반적으로 입력 tokens보다 더 높은 요금이 적용됩니다.

결론

Kimi K2.7 Code는 개인 개발 프로젝트부터 대규모 프로덕션 워크로드까지 확장 가능한 투명하고 유연한 요금 체계를 제공합니다. token 기반 과금, 캐시 할인, 고속 모델 옵션을 통해 개발자는 각자의 요구에 맞춰 성능과 비용의 균형을 조정할 수 있습니다. 덕분에 예측 가능한 지출을 유지하면서 AI 기반 코딩 워크플로를 더 쉽게 구축, 테스트, 배포할 수 있습니다.

자주 묻는 질문

Kimi K2.7 Code API 요금은 어떻게 계산되나요?
Kimi K2.7 Code API는 token 단위 과금 방식을 사용합니다. 모든 요청은 입력 token(프롬프트와 컨텍스트)과 출력 token(모델이 생성한 응답)을 소비합니다. 입력 token은 캐시 미스 시 100만 token당 $0.95, 캐시 히트 시 100만 token당 $0.19로 과금됩니다. 출력 token은 표준 모델의 경우 100만 token당 $4.00, 고속 변형 모델의 경우 100만 token당 $8.00로 과금됩니다. 모든 가격에는 적용 가능한 세금이 제외되어 있습니다.
컨텍스트 캐싱으로 얼마나 절약할 수 있나요?
이전에 처리한 컨텍스트를 재사용하면 캐시된 입력 token은 $0.95가 아닌 100만 token당 $0.19로 과금되어, 반복 컨텍스트의 입력 비용을 80% 절감할 수 있습니다. 따라서 캐싱은 긴 멀티턴 코딩 세션, 반복적인 디버깅 워크플로, 유사한 프롬프트나 코드베이스 컨텍스트를 반복 전송하는 모든 상황에서 특히 효과적입니다.
API를 사용해야 할까요, Kimi 멤버십 플랜을 사용해야 할까요?
맞춤형 도구, CI/CD 파이프라인, 내부 개발자 플랫폼을 구축하고 있어 프로그래밍 방식의 접근과 token 사용량에 대한 세밀한 제어가 필요하다면 API를 사용하세요. API 키를 관리하거나 token 사용량을 예측하지 않고 터미널과 IDE에서 Kimi Code를 바로 쓰고 싶다면 Kimi 멤버십 플랜(월 $19부터)을 선택하는 것이 좋습니다. 멤버십 플랜에는 매주 새로 제공되는 Kimi Code 크레딧이 포함되며, 상위 티어로 갈수록 더 많은 크레딧과 더 높은 동시성이 제공됩니다.
Kimi K2.7 Code API 요금은 엔터프라이즈 규모 사용에도 적합한가요?
예. token 기반 모델은 사용량 상한 없이 개인 개발자부터 엔터프라이즈 배포까지 확장할 수 있습니다. 대규모 사용 환경에서는 세션 간 유사한 입력을 재사용할 때 자동 컨텍스트 캐싱 메커니즘이 비용을 크게 줄여 줍니다. 맞춤형 엔터프라이즈 조건, 전담 지원 또는 대량 할인 혜택이 필요하다면 Kimi API 플랫폼을 통해 Kimi 영업팀에 문의하세요.
Kimi K2.7 Code 요금 | API 비용, 플랜 및 멤버십