개발 업무 지원 위한 Open & Free LLM
개발 업무를 위한 코드 완성, 코드 요약, 코드 스니펫 검색 등 목적을 위해 3가지 LLM 모델 중 선택 가능
- ServiceNow 코드 기반 3B 모델
- HuggingFace 코드 기반 7B 모델
- NVIDIA NeMo 기반 15B 모델

StarCoder 2의 주요 특징
- Text-to-Code, Text-to-Workflow
- 한국어, 영어 등 다국어 텍스트를 코드로 변환
- 온라인에 코드 예제가 드문 언어도 생성 가능

- 경쟁 및 유사 제품: Google DuetAI, AWS CodeWhisperer
- 학습 데이터: 사용 허가 데이터로만 학습
- 라이센스: 일부 제약 조건 있음
- 기업은 자체 데이터와 NVIDIA NeMo, HuggingFace TRL 등 도구를 결합하여 자체 버전 생성 가능

BigCode 프로젝트: StarCoder 2
https://github.com/bigcode-project/starcoder2
코드 학습용 데이터세트: Stack v2
https://huggingface.co/datasets/bigcode/the-stack

NVIDIA AI 모델 카탈로그: 15B 모델 핸즈온
https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-foundation/models/starcoder2-15b

끝 | 감사합니다.