데브허브 | DEVHUB | How BlackRock Built Production AI Agents for Global Asset Management | LangChain InterruptHow BlackRock Built Production AI Agents for Global Asset Management | LangChain Interrupt
- BlackRock은 11조 달러 이상의 자산을 운용하는 세계적인 자산 운용사이며, Aladdin 플랫폼은 투자 관리 프로세스를 통합하는 핵심 기술입니다. 💰
- AI는 BlackRock의 생산성 향상, 알파 생성 촉진, 사용자 경험 개인화를 목표로 하며, Aladdin Copilot을 통해 이 비전을 실현하고 있습니다. ✨
- Aladdin Copilot은 100개 이상의 프런트엔드 애플리케이션에 내장되어 플랫폼 전반의 연결 조직 역할을 하며, 사용자에게 관련 콘텐츠를 선제적으로 제공합니다. 🔗
- Copilot의 핵심 가치는 사용자를 Aladdin 전문가로 만들고, 플랫폼 개인화를 통해 효율성을 높이며, 인사이트 접근성을 민주화하여 더 나은 의사결정을 돕는 것입니다. 💡
- Aladdin Copilot 아키텍처의 핵심은 플러그인 레지스트리로, 수십 개의 엔지니어링 팀이 기존 API(도구) 또는 복잡한 워크플로우(커스텀 에이전트)를 시스템에 쉽게 통합할 수 있도록 합니다. 🔌
- 사용자 쿼리 처리 과정은 LangChain 기반의 오케스트레이션 그래프를 통해 이루어지며, 입력 가드레일(책임감 있는 AI), 필터링 및 접근 제어, GPT-4 기반의 계획 및 실행, 출력 가드레일(환각 감지) 단계를 거칩니다. 🚦
- 수천 개의 플러그인 중 관련성 있는 20-30개만 선택하여 오케스트레이션 단계로 전달함으로써 성능을 최적화합니다. 🎯
- 시스템 평가에는 '감독자(Supervisor)' 모델을 사용하며, 이는 구축, 배포, 테스트가 용이하기 때문입니다. 🧑💻
- '평가 주도 개발(Evaluation-Driven Development)'은 LLM 기반 시스템 개발의 핵심 원칙으로, 전통적인 TDD와 유사하게 시스템 프롬프트 및 엔드투엔드 동작을 철저히 테스트합니다. 🧪
- 특히 금융 분야에서는 잘못된 투자 조언을 방지하기 위해 시스템 프롬프트의 모든 의도된 동작을 합성 데이터와 전문가 검증을 통해 엄격하게 테스트하고 LLM을 심판으로 활용합니다. 🛡️
- CI/CD 파이프라인에 평가 보고서를 통합하여 매일 및 모든 PR에서 실행함으로써 시스템 성능 저하를 방지하고 빠른 개발 속도를 유지합니다. 🚀
- 엔드투엔드 테스트는 개발자가 애플리케이션 컨텍스트, 사용자 설정, 다중 턴 시나리오를 구성하고, 각 플러그인에 대한 '정답(Ground Truth)' 데이터를 제공하여 시스템의 정확한 라우팅 및 문제 해결 능력을 보장합니다. ✅