StarCoder 2: 600여개 언어를 지원하는 오픈 & 프리 코딩 LLM

개발 업무 지원 위한 Open & Free LLM

개발 업무를 위한 코드 완성, 코드 요약, 코드 스니펫 검색 등 목적을 위해 3가지 LLM 모델 중 선택 가능

  • ServiceNow 코드 기반 3B 모델
  • HuggingFace 코드 기반 7B 모델
  • NVIDIA NeMo 기반 15B 모델
StarCoder 2

StarCoder 2의 주요 특징

  • Text-to-Code, Text-to-Workflow
  • 한국어, 영어 등 다국어 텍스트를 코드로 변환
  • 온라인에 코드 예제가 드문 언어도 생성 가능
  • 경쟁 및 유사 제품: Google DuetAI, AWS CodeWhisperer
  • 학습 데이터: 사용 허가 데이터로만 학습
  • 라이센스: 일부 제약 조건 있음
  • 기업은 자체 데이터와 NVIDIA NeMo, HuggingFace TRL 등 도구를 결합하여 자체 버전 생성 가능
Stack (Code Data SRC) for StarCoder 2

BigCode 프로젝트: StarCoder 2
https://github.com/bigcode-project/starcoder2

코드 학습용 데이터세트: Stack v2
https://huggingface.co/datasets/bigcode/the-stack

Stack v2

NVIDIA AI 모델 카탈로그: 15B 모델 핸즈온
https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-foundation/models/starcoder2-15b

StarCoder2 15B from NVIDIA


끝 | 감사합니다.

Leave a Reply