AI 레고 스택: 현대 AI 도구들이 맞물리는 방식
누군가 "AI를 업무에 써봐야겠다"고 결심한다. ChatGPT를 연다. 몇 가지를 시도한다. 되는 것도 있고 안 되는 것도 있다. Claude가 좋다는 말을 듣고 옮겨간다. 코딩엔 Cursor가 좋다는 말에 설치한다. 동료가 n8n으로 자동화해야 한다고 한다. 이미지엔 Midjourney가 있다. Make.com도 있다. 링크드인에 새 툴 포스팅이 올라온다...
AI 레고 스택: 현대 AI 도구들이 맞물리는 방식
"AI로 만들기" 시리즈 3편
요즘 자주 일어나는 장면이 있다.
누군가 "AI를 업무에 써봐야겠다"고 결심한다. ChatGPT를 연다. 몇 가지를 시도한다. 되는 것도 있고 안 되는 것도 있다. Claude가 좋다는 말을 듣고 옮겨간다. 코딩엔 Cursor가 좋다는 말에 설치한다. 동료가 n8n으로 자동화해야 한다고 한다. 이미지엔 Midjourney가 있다. Make.com도 있다. 링크드인에 새 툴 포스팅이 올라온다. 어느새 브라우저 탭이 열일곱 개가 열려 있고, 이걸 과연 다 파악할 수 있을까 하는 막막함이 밀려온다.
익숙한 장면인가?
문제는 도구가 아니다. 이 도구들이 어떻게 맞물리는지 아무도 설명해주지 않았다는 것이다.
구조를 한 번 보고 나면 — 각 레이어가 무엇을 하는지, 어떻게 연결되는지, 어떤 일에 무엇을 고르는지 — 전체 풍경이 압도적으로 느껴지는 것을 멈추고 빌딩 블록처럼 보이기 시작한다. 혼돈이 아니라 레고처럼.
현대 AI 스택의 세 레이어
모든 AI 기반 솔루션은 세 개의 뚜렷한 레이어로 이루어져 있다고 생각하라. 서로 위에 쌓인 구조다. 각 레이어는 역할이 있다. 각각은 아래 레이어에 의존한다.
┌─────────────────────────────────┐
│ 레이어 3: 인터페이스 │ ← 사람이 솔루션과 상호작용하는 방식
├─────────────────────────────────┤
│ 레이어 2: 오케스트레이션 │ ← 작업이 조율되고 자동화되는 방식
├─────────────────────────────────┤
│ 레이어 1: 모델 │ ← 실제 생각을 하는 AI 두뇌
└─────────────────────────────────┘
하나씩 살펴보자.
레이어 1: 모델 — 두뇌
이게 AI 자체다. 언어를 이해하고, 추론하고, 텍스트를 생성하고, 코드를 쓰고, 문서를 요약하고, 질문에 답하는 대형 언어 모델(LLM)이다.
알아야 할 주요 플레이어들:
OpenAI — GPT-5.2 현재 플래그십으로, 코딩과 에이전틱 작업에 최적화됐다. GPT-5 mini와 GPT-5 nano는 잘 정의된 작업에 더 가볍고 빠르고 저렴한 대안이다. ChatGPT나 API를 통해 접근 가능하다.
Anthropic — Claude Opus 4.6, Claude Sonnet 4.6 Claude Opus 4.6은 Anthropic의 가장 강력한 모델이다 — 긴 문서, 미묘한 글쓰기, 복잡한 지시 따르기, 확장된 추론에서 탁월하며, 100만 토큰 컨텍스트 윈도우를 제공한다. Claude Sonnet 4.6은 일상적인 최적점이다: 빠르고, 매우 유능하며, 대부분의 사용 사례에서 비용 효율적이다. claude.ai나 API를 통해 이용 가능하다.
Google — Gemini 3.1 Pro / Gemini 2.5 Pro Gemini 3.1 Pro는 Google의 최신 최고 성능 모델로(현재 프리뷰 단계), 복잡한 문제 해결과 에이전틱 작업을 위해 구축됐다. Gemini 2.5 Pro는 현재 안정적인 프로덕션용 플래그십 — 강력한 추론, 매우 긴 컨텍스트 윈도우, Google 생태계(Docs, Sheets, Gmail)와의 깊은 통합. 텍스트, 이미지, 오디오, 비디오를 기본으로 다루는 강력한 멀티모달 역량을 갖추고 있다.
Meta — Llama 4 (오픈소스) Meta의 최신 오픈소스 모델 패밀리다. 무료이고 로컬 또는 자체 서버에서 실행 가능하다. 데이터 프라이버시, 비용 통제, 또는 독점 모델이 허용하지 않는 커스터마이징이 필요할 때 중요하다. Llama 4는 선도적인 독점 모델들과의 격차를 크게 줄였다.
xAI — Grok 4.20 xAI의 최신 플래그십으로, 업계 최고 수준의 속도와 에이전틱 툴 호출 역량을 갖췄다. X 검색을 통한 X(트위터) 데이터 실시간 접근이 독특한 강점이다 — 소셜 리스닝, 트렌드 분석, 실시간 공개 대화가 신호인 모든 것에 유용하다.
하나를 골라 영원히 고수할 필요가 없다. 모델마다 강점이 다르다. 많은 빌더들이 작업에 따라 다른 모델을 쓴다 — 깊은 추론과 장문 문서엔 Claude Opus 4.6, 코딩과 에이전틱 작업엔 GPT-5.2, Google 생태계 워크플로우엔 Gemini 3.1 Pro. 모델은 교체 가능하다. 프롬프트, 로직, 워크플로우 — 이게 투자할 가치가 있는 자산이다.
레이어 2: 오케스트레이션 — 조율자
모델 단독으로는 강력하지만 한계가 있다. 한 번에 하나의 질문에만 답한다. 매일 아침 자동으로 이메일을 확인하고, CRM에서 데이터를 가져오고, 처리하고, Slack에 요약을 보낼 수 없다. 누군가 거기 앉아서 각 프롬프트를 수동으로 입력하지 않는 한 다단계 워크플로우를 실행할 수 없다.
오케스트레이션 레이어가 하는 일이 바로 그것이다. 조율한다: 올바른 시간에 AI를 트리거하고, 올바른 데이터를 제공하고, 다른 도구에 연결하고, 출력에 자동으로 행동한다.
이게 대부분의 사람들이 건너뛰는 레이어다 — 그리고 진짜 레버리지가 있는 곳이다.
n8n — 시각적 워크플로우 자동화 도구다. 캔버스에 노드(트리거, 액션, AI 호출)를 연결한다. X가 일어나면 Y를 하고, AI를 호출하고, Z를 한다. 오픈소스이고 자체 호스팅 가능하며, 통제권을 원하는 빌더에게 탁월하다. 대부분의 진지한 AI 자동화 워크플로우를 구동하는 것이 이것이다.
Make.com — n8n과 비슷하지만 더 초보자 친화적이고, 클라우드 기반이며, 사전 구축된 커넥터 라이브러리가 많다. 많은 기술적 설정 없이 빠르게 무언가를 실행하고 싶다면 Make가 출발점이다.
LangChain / LlamaIndex — AI가 데이터 및 도구와 상호작용하는 방식에 대한 세밀한 제어를 원하는 개발자 중심 프레임워크다. 개발자와 함께 작업하거나 코딩을 배우고 있다면 이것이 섬세한 제어를 제공한다.
AI 에이전트 — 점점 자체 오케스트레이션 레이어가 되고 있어 별도로 언급할 가치가 있다. 에이전트는 일련의 단계를 계획하고, 도구를 사용하고, 최소한의 인간 개입으로 목표를 완수할 수 있는 AI다 — 본질적으로 자체 단계를 파악하는 워크플로우다. 이 시리즈 후반부에서 에이전트 전체 포스트를 다룰 예정이다.
레이어 3: 인터페이스 — 앞문
이게 사용자가 실제로 보고 만지는 것이다. 인터페이스는 사람이 당신이 만든 것과 상호작용하는 방식이다.
채팅 인터페이스 — 가장 단순하다. 텍스트 박스, 응답. Claude.ai, ChatGPT, API 위에 구축된 커스텀 챗봇. 열린 대화에 좋다.
웹 앱과 대시보드 — Bolt, Lovable, Vercel v0, 또는 전통적인 개발로 구축된다. 채팅 창이 아닌 진짜 제품처럼 느껴지는 제대로 된 UI다.
임베디드 AI — 사용자가 이미 쓰는 기존 도구나 워크플로우에 내장된 AI. Google Docs의 문서를 요약하는 버튼. 보고서를 실행하는 Slack 명령어. 자동 분석을 트리거하는 이메일. 사용자는 "AI를 쓰고 있다"고 생각하지 않는다 — 그냥 도구를 쓸 뿐이다.
음성 인터페이스 — 빠르게 성장하고 있다. 듣고 응답하는 AI. 고객 서비스 봇, 음성 어시스턴트, 회의 전사 및 요약 도구들이다.
인터페이스는 종종 마지막에 구축하지만, 사용자가 가장 먼저 판단하는 것이다. 훌륭한 AI 워크플로우도 어설픈 인터페이스가 있으면 버려진다. 단순한 워크플로우도 깔끔하고 직관적인 인터페이스가 있으면 매일 쓰인다. 이 레이어를 과소평가하지 마라.
레이어들이 연결되는 방식: 실제 예시
구체적으로 만들어보자. 경쟁사 웹사이트를 모니터링하고, 변경된 내용을 요약하고, 주간 다이제스트를 보내주는 도구를 만들고 싶다고 가정하자.
레이어 1 (모델): Claude Sonnet 4.6 또는 GPT-5.2 — 경쟁사 콘텐츠를 읽고 새로운 내용과 왜 중요한지에 대한 명확하고 간결한 요약을 생성한다.
레이어 2 (오케스트레이션): n8n — 매주 월요일 아침 실행되어 경쟁사 URL을 가져오고, 콘텐츠를 AI 모델에 전달하고, 출력을 포맷하고, 이메일이나 Slack으로 보낸다.
레이어 3 (인터페이스): 이메일 받은편지함 또는 Slack 채널 — 다이제스트가 도착하는 곳이다. 화려한 UI가 필요 없다; 인터페이스는 이미 시간을 보내는 곳이다.
이걸 구축하는 데 필요한 코딩: n8n의 시각적 인터페이스와 사전 구축된 이메일 커넥터를 사용한다면 제로다. 로직은 당신 것이다. AI가 읽고 요약한다. 오케스트레이션이 스케줄링과 라우팅을 한다. 인터페이스는 이미 구축돼 있다 — 받은편지함이다.
이게 레고 모델의 실제 작동이다. 각 조각은 역할이 있다. 조립하면 된다. 블록을 처음부터 만들 필요는 없다.
스택 선택 방법
이 모든 걸 한꺼번에 마스터할 필요는 없다. 현재 위치에 따른 실용적인 시작 프레임워크다:
막 시작하는 단계라면:
- 모델: ChatGPT 또는 Claude (채팅 인터페이스 직접 사용)
- 오케스트레이션: 아직 없음 — 워크플로우를 먼저 이해하기 위해 수동으로 해라
- 인터페이스: 채팅 창
무언가를 자동화하고 싶다면:
- 모델: API를 통한 Claude Sonnet 4.6 또는 GPT-5.2
- 오케스트레이션: Make.com (더 쉬움) 또는 n8n (더 강력함)
- 인터페이스: 이메일, Slack, 또는 간단한 웹 폼
진짜 제품을 만들고 싶다면:
- 모델: API를 통한 Claude Opus 4.6 또는 GPT-5.2, 다른 작업에 잠재적으로 여러 모델
- 오케스트레이션: 복잡한 워크플로우를 위한 AI 에이전트가 포함된 n8n 또는 LangChain
- 인터페이스: 깊은 코딩 없이 빠른 UI 구축을 위한 Bolt, Lovable, 또는 v0
일을 처리할 수 있는 가장 단순한 버전으로 시작해라. 필요가 명확해지면 레이어를 추가해라. 대부분의 사람들은 문제를 이해하기 전에 스택을 과도하게 설계한다. 먼저 문제를 이해해라 (1편으로 돌아가서), 그 다음 스택을 선택해라.
대부분의 사람이 저지르는 실수
문제를 이해하기 전에 도구를 고른다.
n8n에 대해 듣고 무엇을 자동화할지 알기도 전에 자동화를 구축한다. 그 수준의 복잡성이 필요한지 알기도 전에 LangChain을 설정한다. 작업에 맞는 것이 아니라 트렌딩인 것을 기준으로 모델을 선택한다.
스택은 사용 사례를 따라야 한다. 그 반대가 아니라.
어떤 도구를 선택하기 전에 물어보라: 해야 할 일이 무엇인가? 그 일에서 AI가 어디에 가치를 더하는가? 결과가 필요한 사람에게 어떻게 전달되는가? 이 세 가지 질문은 레이어 1, 2, 3에 직접 매핑된다. 먼저 답하라. 그 다음 레고 조각을 선택해라.
이것만 기억하자
모든 AI 솔루션에는 세 개의 레이어가 있다: 모델, 오케스트레이션, 인터페이스. 어느 레이어에서 작업하고 있는지 — 그리고 무엇이 필요한지 — 이해하면 도구 압도감이 즉시 해소된다.
모델은 두뇌지만 전체 솔루션은 아니다. 모델 단독으로는 질문에 답한다. 오케스트레이션이 자동으로 행동하게 만든다. 인터페이스가 사용 가능하게 만든다. 진짜 무언가를 위해서는 셋 다 필요하다.
오케스트레이션 레이어에 대부분의 레버리지가 있다 — 그리고 대부분의 사람이 건너뛴다. n8n이나 Make.com 같은 도구로 AI를 트리거, 데이터 소스, 액션에 연결하는 것이 채팅 상호작용을 작동하는 시스템으로 바꾸는 것이다.
다른 작업에 다른 모델 — 교체 가능하다. 하나의 모델에 과도하게 헌신하지 마라. 프롬프트, 로직, 워크플로우가 진짜 자산이다. 모델은 교체 가능한 부품이다.
단순하게 시작하고 필요에 따라 레이어를 추가해라. 먼저 문제를 이해해라. 그 다음 해결하는 최소 스택을 선택해라. 복잡성은 기능이 아니라 비용이다.
더 깊이 배우고 싶다면
이 글은 아키텍처를 다뤘다. 송재희의 AI Development Guide는 각 레이어가 실제로 어떻게 작동하는지 더 깊이 들어간다 — 1인 운영자부터 엔터프라이즈 워크플로우까지 특정 사용 사례를 위해 구축된 스택의 실제 예시들을 담고 있다.
📱 Apple Books ▶️ Google Play Books 🌐 전 플랫폼 구매 (Books2Read)
다음 편: "진짜 문제는 데이터다" — 어떤 AI를 쓰느냐보다 AI에게 무엇을 먹이느냐가 왜 더 중요한지, 그리고 데이터가 실제로 준비됐는지 어떻게 아는지를 다룹니다.