
2026.02.03 / JUN.NXP
핵심 요약 (Executive Summary)

이번 포스트에서는 생성형 AI(Generative AI)의 구조적 계층과 그에 따른 경제적 역학 관계를 분석합니다.
- GenAI 생태계를 구성하는 5대 핵심 계층: 애플리케이션, 에이전트, 플랫폼, 모델, 인프라
- 에이전트 계층: 단순한 대화를 넘어 복잡한 작업을 자동화하고 개인화된 경험을 제공하는 핵심 요소로 부상
- 에이전트 양대 구성 요소: 추론 루프 (reasoning loop) + 도구 (tools)
- 모델 계층: 전통적인 클라우드 기반의 LLM과 함께 온디바이스 AI(Edge AI)를 위한 경량화 기술이 발전
- 경제적 측면: 토큰, 캐릭터, 컴퓨팅 시간 등 다양한 과금 지표와 모델의 복잡도 및 컨텍스트 윈도우 크기에 따른 비용 관리가 중요한 과제로 대두
GenAI 생태계 5개 계층 요약
| 계층명 | 주요 구성 요소 및 기능 |
| 인프라 (Infra) | AI 모델 및 시스템 운영을 위한 기초 컴퓨팅 기반 제공 |
| 모델 (Models) | 방대한 데이터 학습을 통한 패턴 및 관계 파악, 특정 작업 수행을 위한 수학적 구조 |
| 플랫폼 (Platform) | AI 이니셔티브 구축 및 확장을 위한 기반 제공, 도구 및 사전 학습된 모델 지원 |
| 에이전트 (Agents) | 자연어 이해 및 응답, 추론 루프(Reasoning loop), 고급 프롬프트 엔지니어링, 복잡한 작업 자동화 |
| 앱 (Gen AI Apps) | 사용자 경험 생성을 위한 멀티 에이전트 시스템 협업 및 개인화 서비스 제공 |

1. 생성형 AI의 5단계 계층 구조

생성형 AI의 아키텍처는 유기적으로 연결된 다섯 가지 계층으로 정의된다.
- 생성형 AI 앱 (Gen AI Apps): 최종 사용자와 상호작용하는 최상위 서비스 단계.
- 에이전트 (Agents): 자연어 이해를 바탕으로 복잡한 작업을 자율적으로 수행하는 지능형 계층.
- 플랫폼 (Platform): AI 이니셔티브를 구축하고 확장하기 위한 기반(예: GCP의 Vertex AI).
- 모델 (Models): 대규모 데이터로 학습된 수학적 구조체로, 패턴과 관계를 학습하여 과업을 수행.
- 인프라 (Infra): 모델 학습 및 추론을 뒷받침하는 하드웨어 및 네트워크 자원.
2. 에이전트 계층(Agent Layer)의 특성과 구성
에이전트는 생성형 AI 아키텍처에서 단순한 인터페이스 이상의 역할을 수행하며, 사용자 경험을 풍부하게 만드는 핵심 동력이다.
에이전트의 주요 기능
- 자연어 이해 및 응답: 사용자의 의도를 파악하고 적절한 언어로 소통.
- 복잡한 작업 자동화: 다단계 프로세스가 필요한 업무를 스스로 처리.
- 개인화: 사용자의 맥락에 맞춘 최적화된 서비스 제공.
에이전트의 유형 및 시스템 구성
- 멀티 에이전트 시스템 (Multi-agent System): 서로 다른 전문 분야를 가진 여러 에이전트가 하나의 앱 내에서 협력하여 역동적인 사용자 경험을 생성한다. (예: 여행 예약 앱, 고객 지원 앱, 개인화 학습 앱 등)

- 유형 분류:
- 대화형 에이전트 (Conversational Agents): 질문 답변, 일상 대화, 정보 접근 등에 특화.
- 워크플로우 에이전트 (Workflow Agents): 이커머스 주문 이행, 고객 온보딩, 자동화된 리서치, 보안 로그 분석 등 특정 절차 수행에 특화.

에이전트의 2가지 핵심 요소
에이전트는 ‘추론 루프’와 ‘도구(Tools)’를 통해 작동한다.
| 구분 | 상세 내용 |
| 추론 루프 (Reasoning Loop) | 고급 프롬프트 엔지니어링 프레임워크를 사용. 단순 규칙 기반 계산부터 복잡한 사고 체인, 머신러닝 알고리즘, 확률적 추론 기술을 포함함. |
| 주요 프롬프트 기법 | ReAct(Reasoning and Acting) 또는 사고 체인(CoT, Chain-of-Thought) 프롬프팅. |

3. 플랫폼 및 모델 계층의 발전
플랫폼 계층 (Platform Layer)
AI 솔루션의 구축 및 확장을 위한 토대로서, Google Cloud Platform(GCP)의 Vertex AI와 같은 서비스는 인프라, 도구, 그리고 사전 학습된 모델을 통합적으로 제공한다.
모델 계층 (Model Layer) 및 에지 AI (AI on the Edge)
모델은 방대한 데이터를 통해 학습된 수학적 구조체이며, Model Garden을 통해 관리 및 접근이 가능하다. 최근에는 효율적인 배포를 위해 기기 자체에서 실행되는 에지 AI 기술이 강조되고 있다.
- Lite Runtime (LiteRT): 가벼운 런타임 환경 지원.
- Gemini Nano: 모바일 및 에지 기기에 최적화된 모델.
- Android AI Edge SDK: 안드로이드 환경에서의 AI 구현을 위한 개발 키트.


4. 생성형 AI의 경제성 및 비용 구조
생성형 AI를 도입하고 운영하는 데 있어 비용 효율성은 모델의 성능만큼이나 중요한 요소이다.
모델 사용 과금 지표 (Pricing Metrics)
모델 사용료는 주로 다음과 같은 지표를 기준으로 산정된다.
- 토큰(Tokens): 모델이 처리하는 텍스트의 기본 단위.
- 캐릭터(Characters): 입력 및 출력되는 문자 수.
- 요청 수(Requests): API 호출 횟수.
- 컴퓨팅 시간(Compute time): 모델 실행에 소요되는 시간.
비용에 영향을 미치는 핵심 요인

비용은 단순 사용량을 넘어 모델의 구조적 특성에 의해 결정된다.
- 모델 크기 및 복잡도: 모델이 거대하고 복잡할수록 비용 상승.
- 컨텍스트 윈도우 (Context Window): 한 번에 처리할 수 있는 데이터의 양이 많을수록 비용 증가.
- 기능(Features): 모델에 탑재된 특수 기능의 유무.
- 배포 방식: 모델이 배포되는 방식 및 환경에 따른 차이.
참고자료
NXP 노트북 | Generative AI Architecture and Economics
https://notebooklm.google.com/notebook/69f7ba45-03f7-4ac5-97c5-dbcfe18cb9d5?artifactId=a6f98768-4877-484f-b438-f3a6e57599c3
첫 포스팅: 2026.02.03 / 포스트 문의: JUN.NXP (naebon@naver.com)