AI 핸즈온 랩 | ‘2.1 Vertex AI Gemini를 이용한 정보 신뢰성 검증 (그라운딩)’ 프로젝트 가이드

2026.04.11 / 동준상.넥스트플랫폼
(AWS SAA, AWS AIF, GCP GenAI Leader)

핵심 정리 (Executive Summary)

이번 가이드는 Vertex AI에서 제공하는 Gemini 모델의 ‘Grounding(그라운딩)’ 기술에 관한 핵심 통찰을 제공하고 실습을 돕기위한 자료입니다.
Grounding은 생성형 AI 모델이 학습 데이터를 넘어 특정 문서나 데이터 소스에 기반하여 답변을 생성하도록 하는 기술이며, 이를 통해 모델의 환각(Hallucination) 현상을 억제하고, 최신 정보 및 사용자의 고유 데이터에 기반한 정확하고 신뢰도 높은 응답을 도출할 수 있습니다.
주요 활용 소스로는 Google 검색 결과와 Vertex AI Search의 데이터 스토어가 있으며, 이는 기업용 AI 애플리케이션의 정확성과 적용 가능성을 높이는 데 필수적인 역할을 합니다.

실습 주요 단계

실습 단계	주요 학습 목표	사용되는 모델 및 도구	설정 및 구성 세부사항
노트북 설정 및 환경 구성	Vertex AI Workbench 노트북 실행 및 환경 준비	Vertex AI Workbench, JupyterLab, Python 3	Vertex AI Workbench에서 인스턴스 생성 및 JupyterLab 실행, Python 3 커널 선택, 사전 구성된 프로젝트 ID 및 위치 로드
Google 검색 결과 기반 그라운딩	공개적으로 사용 가능한 최신 정보를 활용한 모델 응답 정확도 향상	Gemini Pro, Gemini Flash	노트북의 ‘Example: Grounding with Google Search results’ 섹션 실행
Vertex AI 데이터 스토어 생성	사용자 정의 데이터를 검색할 수 있는 지식 저장소 구축	Vertex AI Search, Cloud Storage	Cloud Storage 경로 ‘gs://cloud-samples-data/gen-app-builder/search/cymbal-bank-employee’ 설정, 전역(Global) 위치 선택 및 이름 지정
Vertex AI 검색 애플리케이션 생성	생성된 데이터 스토어를 검색 애플리케이션과 연결	Vertex AI Search App	‘Site search with AI mode’ 선택, Enterprise 버전 활성화, 앱 ID 생성 및 데이터 스토어 선택
사용자 정의 데이터 기반 그라운딩	기업 내부 문서나 특정 데이터를 기반으로 한 응답 생성	Gemini 모델, Vertex AI Search API	이전 단계에서 생성한 앱 ID를 노트북에 입력하고 그라운딩 섹션 코드 실행
그라운딩된 채팅 응답 구현	대화형 인터페이스에서 그라운딩 기술 적용	Gemini 모델 (채팅 인터페이스)	노트북의 ‘Example: Grounded chat responses’ 섹션 실행 및 대화 모델 설정

1. Grounding 기술의 정의 및 주요 이점

Grounding은 대규모 언어 모델(LLM)이 생성하는 콘텐츠를 실제 문서 및 데이터와 연결하는 프로세스이다. 이는 모델이 훈련 과정에서 학습하지 못한 런타임 정보에 접근할 수 있게 한다.

주요 이점

모델 환각(Hallucination) 감소: 모델이 사실이 아닌 내용을 생성하는 사례를 줄이고, 실제 데이터에 기반한 답변을 하도록 유도한다.
정보의 고정(Anchoring): 모델의 응답을 특정 정보, 문서 및 데이터 소스에 고정하여 답변의 근거를 명확히 한다.
신뢰성 및 정확성 향상: 생성된 콘텐츠의 정확도와 실무 적용 가능성을 높여 사용자 신뢰를 확보한다.

2. Gemini 모델군 분석

Vertex AI에서 제공하는 Gemini API는 다양한 형태의 콘텐츠(텍스트, 코드, 이미지, 오디오, 비디오)를 이해하고 생성할 수 있는 통합 인터페이스를 제공한다.

모델명	주요 특징 및 최적화 분야
Gemini Pro	복잡한 추론에 설계됨. 대량의 정보 분석 및 요약, 정교한 교차 모달(Cross-modal) 추론, 복잡한 코드베이스 문제 해결에 탁월함.
Gemini Flash	속도와 효율성에 최적화됨. 초단위 미만의 응답 시간과 높은 처리량 제공. 저비용으로 높은 품질의 작업 수행. 공간 이해도 향상 및 기본 도구(Google 검색, 코드 실행 등) 사용 기능 포함.

3. Grounding 데이터 소스 유형

Vertex AI에서는 두 가지 주요 소스를 통해 Grounding을 구성할 수 있다.

Google 검색 결과: 공개적으로 사용 가능하고 인덱싱된 데이터를 활용한다. 프로덕션 애플리케이션에서 사용 시 Google 검색 진입점(Entry point)이 필요하다.
Vertex AI Search 데이터 스토어: 기업 내부의 고유 데이터를 활용한다. 웹사이트 데이터, 비정형 데이터(PDF, HTML, TXT 등), 정형 데이터 등을 포함할 수 있다.

4. 실습을 통한 Grounding 구현 프로세스

문서에 제시된 실습 과정은 Grounding을 실제 애플리케이션에 통합하는 구체적인 단계를 보여준다.

4.1. 데이터 스토어(Data Store) 생성

데이터 소스 선택: Cloud Storage 등에서 데이터를 가져온다. (예: 비정형 문서)
구성: 데이터 스토어의 위치(Global)를 설정하고 이름을 지정하여 생성한다.

4.2. Vertex AI Search 애플리케이션 구축

앱 생성: ‘AI 모드가 포함된 사이트 검색(Site search with AI mode)’ 등을 선택하여 앱을 생성한다.
엔터프라이즈 기능: 엔터프라이즈 버전 기능을 활성화하여 고급 기능을 사용한다.
데이터 연결: 앞서 생성한 데이터 스토어를 앱에 연결한다.
인덱싱: 앱이 검색 콘텐츠를 인덱싱할 때까지 대기(약 5~10분)한다.

4.3. 모델 연동 및 비교

비교 분석: Grounding을 적용하지 않은 모델의 응답과 Google 검색 또는 데이터 스토어를 통해 Grounding된 응답을 비교하여 품질 차이를 확인한다.
채팅 응답 구현: Vertex AI Workbench의 JupyterLab 환경에서 Python SDK를 사용하여 실제 Grounding된 채팅 응답을 생성한다.

결론 및 시사점

Vertex AI의 Gemini Grounding 기술은 LLM의 고질적인 문제인 정보의 불확실성을 해결하는 실질적인 솔루션을 제공한다.
사용자는 공개 데이터(Google 검색)와 내부 데이터(Custom Data Store)를 유연하게 결합하여 모델의 지식 범위를 확장할 수 있다.
특히 Gemini Pro의 추론 능력과 Gemini Flash의 효율성을 Grounding과 결합함으로써, 기업은 신속하면서도 정확한 비즈니스용 AI 서비스를 구축할 수 있는 기술적 토대를 마련할 수 있다.