
2026.02.13 / JUN.NXP
핵심 요약 (Executive Summary)

Composer는 Cursor 팀이 개발한 최신 에이전트 모델로, 소프트웨어 엔지니어링 작업에서 프런티어급 성능을 유지하면서도 유사 모델 대비 4배 빠른 생성 속도를 달성했다. 이 모델은 대규모 코드베이스 내의 실제 문제를 해결하는 과정을 강화학습(Reinforcement Learning, RL)함으로써 최적화되었다. 주요 특징은 다음과 같다.
- 전문성: MoE(Mixture-of-Experts, 혼합 전문가) 구조를 채택하여 롱 컨텍스트 이해와 생성에 특화됨.
- 속도: 저정밀도(MXFP8) 네이티브 훈련을 통해 별도의 사후 양자화 없이도 극도로 빠른 추론 속도 구현.
- 자율성: 시맨틱 검색, 코드 편집, 터미널 명령 실행 등 다양한 도구를 효율적으로 사용하는 능력을 스스로 학습.
- 효율성: 개발자의 작업 흐름(Flow)을 방해하지 않는 상호작용 가능한 속도와 지능의 균형 달성.

1. 개발 동기 및 철학

Composer의 개발은 Cursor Tab(커스텀 완성 모델)의 개발 경험에서 비롯되었다. 개발자들은 작업의 몰입감을 유지하기 위해 대화형 사용이 가능한 수준의 빠른 속도와 높은 지능을 동시에 갖춘 모델을 필요로 한다.
- 프로토타입 ‘Cheetah’: 빠른 에이전트 모델의 영향력을 이해하기 위해 초기 모델인 Cheetah를 개발하여 실험을 진행했다.
- Composer의 진화: Composer는 Cheetah보다 더 똑똑한 버전으로, 빠른 속도를 통해 코딩 경험을 더욱 즐겁게 만들도록 설계되었다.
- 내부 활용: Cursor 팀은 스스로 개발한 도구를 직접 사용하는 원칙에 따라, 실제 일상적인 소프트웨어 개발 업무에 Composer를 적용하여 그 유용성을 검증했다.
2. 기술적 아키텍처 및 훈련 방법론

2.1 모델 구조 및 특화
Composer는 소프트웨어 엔지니어링에 특화된 MoE 언어 모델이다. 매 훈련 반복마다 모델은 문제 설명을 받고 코드 수정, 계획 수립, 정보 제공 등의 최적 응답을 생성하도록 지시받는다.
2.2 강화학습(RL)을 통한 최적화
강화학습은 모델이 소프트웨어 엔지니어링에 효과적으로 전문화되도록 돕는 핵심 요소이다.
- 도구 활용: 단순한 파일 읽기/쓰기부터 복잡한 터미널 명령 및 코드베이스 전반의 시맨틱 검색까지 활용 가능.
- 효율성 인센티브: 도구 사용 시 효율적인 선택을 하고 병렬 처리를 극대화하도록 보상 설계.
- 도움되는 조항: 불필요한 응답을 줄이고, 근거 없는 주장을 최소화하도록 훈련됨.
- 창발적 행동: RL 과정에서 복잡한 검색 수행, 린터(Linter) 에러 수정, 유닛 테스트 작성 및 실행과 같은 유용한 행동을 자율적으로 학습함.
2.3 저정밀도 및 시스템 혁신
- MXFP8 커널: MXFP8 MoE 커널을 전문가 병렬성(Expert Parallelism) 및 하이브리드 샤딩 데이터 병렬성(Hybrid Sharded Data Parallelism)과 결합하여 대규모 GPU 환경에서 통신 비용을 최소화하며 훈련했다.
- 추론 가속: MXFP8로 네이티브하게 훈련함으로써 사후 양자화 과정 없이도 빠른 추론 속도를 제공한다.
3. 인프라 및 시스템 연구

대규모 MoE 모델을 효율적으로 훈련하기 위해 상당한 시스템 투자가 이루어졌다.
- 확장성: PyTorch와 Ray를 기반으로 구축된 커스텀 인프라를 통해 수천 개의 NVIDIA GPU로 훈련을 확장했다.
- 가상화 환경: 모델이 도구를 호출하고 테스트할 수 있도록 클라우드에서 수십만 개의 동시 샌드박스 코딩 환경을 실행한다.
- VM 스케줄러 재설계: 훈련 실행의 폭발적인(Bursty) 특성을 지원하기 위해 기존 ‘Background Agents’ 인프라를 기반으로 가상 머신 스케줄러를 재작성하여 RL 환경과 운영 환경을 통합했다.
4. 성능 평가: Cursor Bench
모델의 성능을 측정하기 위해 실제 개발 환경과 가장 유사한 형태의 벤치마크인 Cursor Bench를 구축했다.
- 구성: Cursor 엔지니어 및 연구원들의 실제 에이전트 요청 사항과 이에 대한 수작업으로 큐레이팅된 최적의 솔루션으로 구성됨.
- 측정 지표: 단순한 정답 여부를 넘어, 코드베이스의 기존 추상화 계층 및 소프트웨어 엔지니어링 관행을 얼마나 잘 준수하는지 측정한다.
| 사용 가능 도구 | 성능 벤치마크 결과 | 하드웨어 및 인프라 |
| 파일 읽기 및 편집, 터미널 명령 실행, 코드베이스 의미론적 검색(Semantic Search), 문자열 검색(Grep), 단위 테스트 실행 | Cursor Bench에서 타 모델 대비 4배 빠른 속도로 프론티어급 코딩 결과 달성 (Haiku 4.5, Gemini Flash 2.5 등 Fast Frontier 클래스 및 Qwen Coder 등과 비교) | 수천 개의 NVIDIA GPU, 전문가 병렬 처리(Expert Parallelism) 및 하이브리드 샤딩 데이터 병렬 처리, 클라우드 기반 수십만 개의 샌드박스 코딩 환경 |
결론
- Composer는 고성능 AI 코딩 지능을 대화형 속도로 구현한 모델
- 강화학습 기반 소프트웨어 엔지니어링 능력 극대화 + 인프라 레벨 기술 혁신
- 단순한 코드 생성을 넘어 복잡한 엔지니어링 과제의 자율적 해결 역량 겸비
- 개발자가 흐름을 유지하며 보다 생산적으로 협업할 수 있는 환경을 제공
참고자료 및 다운로드
Cursor Composer: 모델 및 기술 사양 요약 (시트 다운로드)
https://docs.google.com/spreadsheets/d/1qv9FzzcFp0kkf__L08IgRmBdqVwi9Y_Bph042OvSlWc/edit?usp=sharing
Cursor Composer: AI 코딩용 고속 강화학습(RL) 아키텍처 (슬라이드 다운로드)
https://drive.google.com/file/d/1vLokbYdxdKSGk8d3S5XjF0bHZnTfq-Y1/view?usp=sharing