
2026.04.11 / 동준상.넥스트플랫폼
(AWS SAA, AWS AIF, GCP GenAI Leader)
핵심 정리 (Executive Summary)
- 이번 가이드는 Vertex AI에서 제공하는 Gemini 모델의 ‘Grounding(그라운딩)’ 기술에 관한 핵심 통찰을 제공하고 실습을 돕기위한 자료입니다.
- Grounding은 생성형 AI 모델이 학습 데이터를 넘어 특정 문서나 데이터 소스에 기반하여 답변을 생성하도록 하는 기술이며, 이를 통해 모델의 환각(Hallucination) 현상을 억제하고, 최신 정보 및 사용자의 고유 데이터에 기반한 정확하고 신뢰도 높은 응답을 도출할 수 있습니다.
- 주요 활용 소스로는 Google 검색 결과와 Vertex AI Search의 데이터 스토어가 있으며, 이는 기업용 AI 애플리케이션의 정확성과 적용 가능성을 높이는 데 필수적인 역할을 합니다.
실습 주요 단계
| 실습 단계 | 주요 학습 목표 | 사용되는 모델 및 도구 | 설정 및 구성 세부사항 |
| 노트북 설정 및 환경 구성 | Vertex AI Workbench 노트북 실행 및 환경 준비 | Vertex AI Workbench, JupyterLab, Python 3 | Vertex AI Workbench에서 인스턴스 생성 및 JupyterLab 실행, Python 3 커널 선택, 사전 구성된 프로젝트 ID 및 위치 로드 |
| Google 검색 결과 기반 그라운딩 | 공개적으로 사용 가능한 최신 정보를 활용한 모델 응답 정확도 향상 | Gemini Pro, Gemini Flash | 노트북의 ‘Example: Grounding with Google Search results’ 섹션 실행 |
| Vertex AI 데이터 스토어 생성 | 사용자 정의 데이터를 검색할 수 있는 지식 저장소 구축 | Vertex AI Search, Cloud Storage | Cloud Storage 경로 ‘gs://cloud-samples-data/gen-app-builder/search/cymbal-bank-employee’ 설정, 전역(Global) 위치 선택 및 이름 지정 |
| Vertex AI 검색 애플리케이션 생성 | 생성된 데이터 스토어를 검색 애플리케이션과 연결 | Vertex AI Search App | ‘Site search with AI mode’ 선택, Enterprise 버전 활성화, 앱 ID 생성 및 데이터 스토어 선택 |
| 사용자 정의 데이터 기반 그라운딩 | 기업 내부 문서나 특정 데이터를 기반으로 한 응답 생성 | Gemini 모델, Vertex AI Search API | 이전 단계에서 생성한 앱 ID를 노트북에 입력하고 그라운딩 섹션 코드 실행 |
| 그라운딩된 채팅 응답 구현 | 대화형 인터페이스에서 그라운딩 기술 적용 | Gemini 모델 (채팅 인터페이스) | 노트북의 ‘Example: Grounded chat responses’ 섹션 실행 및 대화 모델 설정 |
1. Grounding 기술의 정의 및 주요 이점
Grounding은 대규모 언어 모델(LLM)이 생성하는 콘텐츠를 실제 문서 및 데이터와 연결하는 프로세스이다. 이는 모델이 훈련 과정에서 학습하지 못한 런타임 정보에 접근할 수 있게 한다.
주요 이점
- 모델 환각(Hallucination) 감소: 모델이 사실이 아닌 내용을 생성하는 사례를 줄이고, 실제 데이터에 기반한 답변을 하도록 유도한다.
- 정보의 고정(Anchoring): 모델의 응답을 특정 정보, 문서 및 데이터 소스에 고정하여 답변의 근거를 명확히 한다.
- 신뢰성 및 정확성 향상: 생성된 콘텐츠의 정확도와 실무 적용 가능성을 높여 사용자 신뢰를 확보한다.
2. Gemini 모델군 분석
Vertex AI에서 제공하는 Gemini API는 다양한 형태의 콘텐츠(텍스트, 코드, 이미지, 오디오, 비디오)를 이해하고 생성할 수 있는 통합 인터페이스를 제공한다.
| 모델명 | 주요 특징 및 최적화 분야 |
| Gemini Pro | 복잡한 추론에 설계됨. 대량의 정보 분석 및 요약, 정교한 교차 모달(Cross-modal) 추론, 복잡한 코드베이스 문제 해결에 탁월함. |
| Gemini Flash | 속도와 효율성에 최적화됨. 초단위 미만의 응답 시간과 높은 처리량 제공. 저비용으로 높은 품질의 작업 수행. 공간 이해도 향상 및 기본 도구(Google 검색, 코드 실행 등) 사용 기능 포함. |
3. Grounding 데이터 소스 유형
Vertex AI에서는 두 가지 주요 소스를 통해 Grounding을 구성할 수 있다.
- Google 검색 결과: 공개적으로 사용 가능하고 인덱싱된 데이터를 활용한다. 프로덕션 애플리케이션에서 사용 시 Google 검색 진입점(Entry point)이 필요하다.
- Vertex AI Search 데이터 스토어: 기업 내부의 고유 데이터를 활용한다. 웹사이트 데이터, 비정형 데이터(PDF, HTML, TXT 등), 정형 데이터 등을 포함할 수 있다.
4. 실습을 통한 Grounding 구현 프로세스
문서에 제시된 실습 과정은 Grounding을 실제 애플리케이션에 통합하는 구체적인 단계를 보여준다.
4.1. 데이터 스토어(Data Store) 생성
- 데이터 소스 선택: Cloud Storage 등에서 데이터를 가져온다. (예: 비정형 문서)
- 구성: 데이터 스토어의 위치(Global)를 설정하고 이름을 지정하여 생성한다.
4.2. Vertex AI Search 애플리케이션 구축
- 앱 생성: ‘AI 모드가 포함된 사이트 검색(Site search with AI mode)’ 등을 선택하여 앱을 생성한다.
- 엔터프라이즈 기능: 엔터프라이즈 버전 기능을 활성화하여 고급 기능을 사용한다.
- 데이터 연결: 앞서 생성한 데이터 스토어를 앱에 연결한다.
- 인덱싱: 앱이 검색 콘텐츠를 인덱싱할 때까지 대기(약 5~10분)한다.
4.3. 모델 연동 및 비교
- 비교 분석: Grounding을 적용하지 않은 모델의 응답과 Google 검색 또는 데이터 스토어를 통해 Grounding된 응답을 비교하여 품질 차이를 확인한다.
- 채팅 응답 구현: Vertex AI Workbench의 JupyterLab 환경에서 Python SDK를 사용하여 실제 Grounding된 채팅 응답을 생성한다.
결론 및 시사점
- Vertex AI의 Gemini Grounding 기술은 LLM의 고질적인 문제인 정보의 불확실성을 해결하는 실질적인 솔루션을 제공한다.
- 사용자는 공개 데이터(Google 검색)와 내부 데이터(Custom Data Store)를 유연하게 결합하여 모델의 지식 범위를 확장할 수 있다.
- 특히 Gemini Pro의 추론 능력과 Gemini Flash의 효율성을 Grounding과 결합함으로써, 기업은 신속하면서도 정확한 비즈니스용 AI 서비스를 구축할 수 있는 기술적 토대를 마련할 수 있다.