데브허브 | DEVHUB | Voice AI Agents: Full Guide from Beginner to Pro (n8n + 11Labs)Voice AI Agents: Full Guide from Beginner to Pro (n8n + 11Labs)
- 11 Labs와 n8n을 활용하여 강력한 음성 AI 에이전트를 구축하는 방법을 소개합니다. 🗣️
- 11 Labs 플랫폼은 웹사이트에 임베드 가능한 위젯 형태의 음성 AI 에이전트 기능을 제공하며, 향후 Twilio를 통한 전화 통합도 가능합니다. 🌐
- 11 Labs 계정 생성 후, 무료 티어 또는 Starter/Creator 유료 플랜을 통해 음성 복제 및 더 많은 크레딧을 활용할 수 있습니다. 💳
- 에이전트 생성 시, 지원, 튜터 등 사전 구축된 템플릿을 선택하거나 빈 템플릿으로 완전히 맞춤 설정할 수 있습니다. 🛠️
- 에이전트 언어 설정은 다국어를 지원하여 다양한 국가 및 고객 요구에 맞춰 에이전트를 구축할 수 있습니다. 🌍
- 에이전트의 첫 메시지와 시스템 프롬프트(페르소나 및 행동 정의)를 사용자 정의하여 에이전트의 초기 응답과 성격을 설정합니다. 💬
- "Test AI Agent" 기능을 통해 실시간으로 에이전트와 상호작용하며 변경 사항을 즉시 테스트할 수 있습니다. 🧪
- 음성 에이전트는 사용자의 말을 중간에 끊고 다시 듣기 모드로 전환하는 인터럽트 기능을 지원하여 자연스러운 대화가 가능합니다. 👂
- 개발 단계의 통화는 분당 500 크레딧을 소모하므로, 크레딧 관리가 중요합니다. 💰
- LLM(대규모 언어 모델)은 실시간 대화를 위해 Google Gemini 1.1 Flash가 기본으로 설정되어 있으며, GPT-4 Turbo, Claude 2.5 등 더 강력한 모델이나 커스텀 LLM을 선택할 수 있습니다. 🧠
- LLM의 '온도(Temperature)' 설정을 통해 에이전트 응답의 창의성 또는 무작위성을 조절할 수 있습니다. 🔥
- 지식 기반(Knowledge Base) 기능을 통해 파일(PDF, 텍스트, HTML 등), URL 스크래핑, 수동 텍스트 입력 방식으로 에이전트에 정보를 제공할 수 있습니다. 📚
- '도구(Tools)' 섹션은 11 Labs 에이전트와 n8n 백엔드를 웹훅을 통해 연결하여 강력한 기능을 구현하는 핵심 부분입니다. 🔗
- '음성(Voice)' 탭에서 11 Labs 기본 음성 또는 복제된 음성 중에서 에이전트의 목소리를 선택할 수 있습니다. 🎤
- TTPS 출력 형식, 발음 사전, 스트리밍 지연 시간, 안정성, 유사성 등 고급 음성 설정을 통해 에이전트의 음성 품질과 특성을 최적화할 수 있습니다. 🔊
- '분석(Analytics)' 탭의 평가 기준을 설정하여 고객과의 대화 데이터를 수집하고 에이전트 성능에 대한 통찰력을 얻을 수 있습니다. 📊
- '제한(Limitations)' 탭에서 대화 시간 제한(예: 최대 대화 지속 시간)을 설정하여 크레딧 소모를 관리할 수 있습니다. ⏱️
- '위젯(Widget)' 탭에서 제공되는 코드 스니펫을 웹사이트에 복사하여 에이전트 위젯을 쉽게 임베드하고, 위젯의 색상 등을 사용자 정의할 수 있습니다. 🎨