- Vapi는 음성 AI 에이전트 구축을 위한 노코드 플랫폼이며, n8n과 결합하여 무한한 자동화 가능성을 제공합니다. 🔗
- 음성 에이전트는 전화나 웹사이트를 통해 사람들과 자연스러운 실시간 대화를 나누는 가상 비서로, 챗봇과 달리 음성을 사용합니다. 🗣️
- 음성 에이전트의 핵심 구성 요소는 음성-텍스트 변환(STT), 대규모 언어 모델(LLM), 텍스트-음성 변환(TTS)입니다. 🔄
- 에이전트의 주요 해부학적 구조는 LLM(두뇌), 시스템 프롬프트(지침), 음성(목소리), 도구(기능)로 구성됩니다. 🧠
- OpenAI, Google, Anthropic 등 다양한 LLM을 에이전트의 두뇌로 활용할 수 있으며, 모델별 비용과 지연 시간이 다릅니다. 💡
- 시스템 프롬프트는 에이전트의 역할, 성격, 규칙, 대화 흐름을 정의하는 가장 중요한 부분이며, 지속적인 반복 개선이 필수적입니다. 📝
- Vapi, 11 Labs 등 다양한 제공업체를 통해 남성, 여성, 연령대, 억양 등 맞춤형 음성을 선택하여 에이전트의 목소리를 설정할 수 있습니다. 🎤
- 도구는 에이전트가 캘린더 확인, 이벤트 생성, 이메일 전송 등 실제 작업을 수행할 수 있도록 하는 핵심 기능입니다. 🛠️
- n8n 워크플로우를 Vapi 에이전트의 도구로 활용하여 구글 캘린더 예약, 고객 정보 조회, 이메일 발송 등 복잡한 자동화를 구현할 수 있습니다. 🚀
- 음성 에이전트는 인바운드(고객 문의 응대), 아웃바운드(능동적 전화 발신), 웹사이트 위젯(인바운드와 유사)의 세 가지 주요 유형이 있습니다. 📞
- 음성 에이전트 시장은 2026년에 크게 성장할 것으로 예상되며, 높은 ROI와 영향력을 제공하는 중요한 기회의 영역입니다. 📈
- 이 비디오는 Vapi 설정, 프롬프트 작성, 지식 기반(파일) 추가, 도구 연결, 통화 후 보고서 자동화 등 실질적인 구축 과정을 다룹니다. 🏗️
- Vapi 대시보드에서는 어시스턴트(에이전트 생성) 및 도구(기능 생성) 섹션이 핵심적인 역할을 합니다. 📊
- 에이전트 구성 시 모델, 첫 메시지, 시스템 프롬프트, 파일(지식 기반), 최대 토큰(비용 제어), 온도(무작위성 제어), 음성, 도구 등을 세밀하게 설정할 수 있습니다. ⚙️
- 정책 및 FAQ 문서와 같은 지식 기반 파일을 Vapi에 직접 업로드하여 에이전트가 해당 정보를 활용하도록 할 수 있습니다. 📚
- 고품질 에이전트를 위해 에이전트의 정체성, 목적, 성격, 대화 흐름, 특정 시나리오별 지침 등을 시스템 프롬프트에 상세하게 정의하는 것이 중요합니다. ✨
- 프롬프트는 한 번에 완벽하게 만들 수 없으므로, 테스트하고 피드백을 받아 지속적으로 개선하는 반복적인 개발 과정이 성공의 열쇠입니다. 🔁





