Kimi K2.7 Code

장기 소프트웨어 엔지니어링을 위해 구축된 오픈소스 코딩 중심 agentic 모델

8분 읽기2026-06-18

Kimi K2.7 Code란 무엇인가요?

Kimi K2.7 Code는 Moonshot AI가 개발한 오픈소스 코딩 중심 agentic 모델입니다. 코딩과 agent 성능이 한층 강화되었으며, 실제 장기 코딩 작업에서 크게 개선되었습니다. 이러한 향상은 복잡한 소프트웨어 엔지니어링 워크플로 전반에서 더 높은 엔드투엔드 작업 성공률로 이어집니다. 또한 K2.7 Code는 추론 효율을 개선해 K2.6 대비 thinking-token 사용량을 약 30% 줄였습니다.

벤치마크 성능

Kimi K2.7 Code는 코딩 역량과 agentic 작업 실행이라는 두 차원을 아우르는 내부 및 외부 벤치마크 조합에서 K2.6과 비교 평가되었습니다.

Kimi K2.7 Code, Kimi K2.6, GPT-5.5, Claude Opus 4.8의 여섯 가지 코딩 및 agentic 벤치마크 비교

코딩 벤치마크에서 K2.7 Code는 K2.6 대비 큰 향상을 보였습니다. Kimi Code Bench v2에서는 +21.8%(62.0 대 50.9), Program Bench에서는 +11.0%(53.6 대 48.3), MLS Bench Lite에서는 +31.5%(35.1 대 26.7)를 기록했습니다.

강화된 코딩 역량은 더 강력한 agentic 성능으로도 이어집니다. 자율 agent 작업 실행을 측정하는 벤치마크인 Kimi Claw 24/7 Bench, MCP Atlas, MCP Mark Verified에서 K2.7 Code는 K2.6 대비 약 10% 향상되었습니다.

코딩:

벤치마크	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentic:

벤치마크	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

Kimi Code Bench v2는 Moonshot AI가 개발한 내부 벤치마크이며, Kimi Claw 24/7 Bench는 agentic 평가를 위한 내부 벤치마크입니다. Kimi K2.7 Code와 K2.6은 사고를 활성화한 Kimi Code CLI(temperature 1.0, top-p 0.95, 262,144-token 컨텍스트)로 테스트했으며, GPT-5.5는 Codex(xhigh), Opus 4.8은 Claude Code(xhigh)에서 평가했습니다. 벤치마크별 예외 사항과 전체 방법론은 Hugging Face 모델 카드에 자세히 설명되어 있습니다.

장기 코딩을 위한 설계

실제 소프트웨어 엔지니어링은 한 단계로 끝나는 일이 드뭅니다. 코드베이스 리팩터링, 여러 파일에 걸친 기능 구현, 긴 agent 세션에서의 디버깅 같은 작업에는 모델이 확장된 컨텍스트 전반에서 지시를 안정적으로 따르고 작업을 끝까지 완수하는 능력이 필요합니다.

Kimi K2.7 Code는 이러한 장기 시나리오에 최적화되어 있습니다. K2.6보다 긴 컨텍스트에서 지시를 더 안정적으로 따르고 엔드투엔드 작업 성공률도 높아, 복잡한 소프트웨어 엔지니어링 워크플로에 더 적합합니다.

Kimi Code에서 사용해 보기

최적화된 추론 효율

추론 모델은 필요 이상으로 오래 생각해, 그럴 필요가 없는 문제에도 수천 tokens를 소비하는 경향이 있습니다. Kimi K2.7 Code는 이러한 경향을 크게 줄였습니다. K2.6 대비 thinking-token 사용량을 평균 약 30% 절감합니다.

Kimi Code Bench v2, Program Bench, MLS Bench Lite 전반에서 Kimi K2.7 Code는 각 벤치마크마다 더 적은 tokens를 사용하면서도 K2.6보다 높은 점수를 달성했습니다.

개발자에게 이러한 효율성은 모든 작업에서 누적 효과를 냅니다. 인터랙티브 코딩 세션에서는 더 빠른 응답을, 프로덕션에서는 더 낮은 API 비용을, agent 워크플로에서는 동일한 컨텍스트 예산 안에서 더 많은 작업 완료를 가능하게 합니다.

Kimi Code에서 사용해 보기

모델 아키텍처

Kimi K2.7 Code는 총 1조 개 파라미터와 token당 320억 개 활성화 파라미터를 갖춘 Mixture-of-Experts(MoE) 아키텍처를 기반으로 구축되었습니다. 이 모델은 256K 컨텍스트 길이를 지원하며 Multi-head Latent Attention(MLA)을 사용합니다. 또한 4억 파라미터 비전 인코더인 MoonViT도 포함합니다.

매개변수	값
아키텍처	Mixture-of-Experts (MoE)
전체 파라미터	1T
활성화 파라미터	32B
레이어 수(Dense layer 포함)	61
Dense Layers 수	1
Attention Hidden Dimension	7168
MoE Hidden Dimension(Expert당)	2048
Attention Heads 수	64
Experts 수	384
Token당 선택되는 Experts 수	8
공유 Experts 수	1
어휘 크기	160K
컨텍스트 길이	256K
Attention Mechanism	MLA
활성화 함수	SwiGLU
비전 인코더	MoonViT
비전 인코더 파라미터	400M

전체 모델 가중치는 오픈소스로 공개되어 Hugging Face에서 이용할 수 있습니다.

Kimi K2.7 Code와 K2.6 선택 기준

Kimi K2.7 Code는 코딩 작업에 특화되어 설계되었습니다. 글쓰기, 분석, 대화처럼 범용 작업에는 더 균형 잡힌 역량을 제공하는 K2.6을 권장합니다.

Kimi K2.7 Code 이용 방법

사용 위치

Kimi K2.7 Code는 다음을 통해 이용할 수 있습니다.

Kimi Code(https://www.kimi.com/code). Kimi K2.7 Code는 이제 기본 모델이며, thinking mode가 기본으로 활성화되어 있습니다. 시작하려면 페이지의 설정 안내를 따라 주세요.
오픈 플랫폼의 Kimi API(https://platform.kimi.ai/). 개발자는 Kimi API로 Kimi K2.7 Code를 호출해 자체 코딩 워크플로, agents, 개발자 도구에 통합할 수 있습니다.

thinking mode 요구 사항

Kimi K2.7 Code는 비사고 모드를 지원하지 않습니다. Kimi API와 Kimi Code 모두에서 항상 사고가 활성화된 상태로 실행됩니다. Kimi Code에서 사고를 비활성화한 요청은 자동으로 K2.6으로 처리됩니다.

Kimi K2.7 Code 가격

Kimi Code 플랜

터미널과 IDE 플러그인을 포함해 Kimi Code에서 Kimi K2.7 Code를 직접 사용해 보려는 사용자는 Code 플랜을 선택할 수 있습니다. 아래 표시된 가격은 연간 결제 기준 월 요금입니다.

플랜	가격	추천 대상
Moderato	월 $15	정기적인 코딩 워크플로에 주 단위로 갱신되는 사용량 한도와 다중 기기 접근이 필요한 사용자
Allegretto	월 $31	더 큰 주간 한도와 더 높은 동시 실행 한도가 필요한 고급 사용자
Allegro	월 $79	고강도 개발 작업, 복잡한 프로젝트, 더 큰 규모의 워크로드를 수행하는 사용자
Vivace	월 $159	복잡한 프로젝트와 대규모 코드베이스에 가장 높은 주간 플랜 한도가 필요한 사용자

각 플랜에는 주 단위로 갱신되는 사용량 한도가 포함됩니다. 상위 플랜은 더 큰 주간 한도와 더 높은 동시 실행 한도를 제공하므로 더 복잡한 프로젝트에 적합합니다. 최신 플랜 정보는 공식 멤버십 페이지를 참조하세요.

Kimi API 가격

Kimi K2.7 Code는 Kimi API를 통해 사용량 기반 token 단위 과금으로 이용할 수 있습니다.

모델	단위	입력 가격(캐시 적중)	입력 가격(캐시 미스)	출력 가격	컨텍스트 창
kimi-k2.7-code	1M tokens	$0.19	$0.95	$4.00	262,144 tokens

API는 자동 컨텍스트 캐싱을 지원하므로 재사용되는 컨텍스트의 입력 비용을 낮출 수 있습니다(캐시 적중 시 100만 tokens당 $0.19, 캐시 미스 시 $0.95). 가격에는 관련 세금이 제외되어 있습니다. 최신 요금은 공식 가격 문서를 참조하세요.

자주 묻는 질문

Kimi K2.7 Code는 오픈소스인가요?

예. 모델 가중치는 오픈소스로 공개되어 Hugging Face에서 다운로드할 수 있으며, 배포 가이드와 전체 문서도 함께 확인할 수 있습니다.

Kimi K2.7 Code의 컨텍스트 창은 어느 정도인가요?

Kimi K2.7 Code는 256K 컨텍스트 창(262,144 tokens)을 지원하므로, 리포지토리 규모의 코드베이스와 긴 다중 턴 코딩 세션에 적합합니다.

Kimi K2.7 Code는 이미지와 동영상 입력을 지원하나요?

예. Kimi K2.7 Code는 코딩 및 agentic 역량에 더해 텍스트, 이미지, 동영상 입력을 지원하는 네이티브 멀티모달 아키텍처를 사용합니다.

Kimi K2.7 Code를 사용하려면 사고 모드가 필요한가요?

예. Kimi K2.7 Code는 비사고 모드를 지원하지 않으며 항상 사고가 활성화된 상태로 실행됩니다. Kimi Code에서 사고를 비활성화한 요청은 자동으로 K2.6으로 처리됩니다.