How to Run Multi-Modal Experiments in LangSmith Playground
- LangSmith Playground는 텍스트 외 이미지, PDF 등 멀티모달 데이터 실험을 지원합니다. 🖼️
- 멀티모달 실험은 데이터셋 생성, 프롬프트 로직 정의, 평가 지표 설정, 결과 비교의 4단계로 진행됩니다. ⚙️
- 영수증 파싱 예시처럼, 입력 첨부 파일과 참조 출력을 포함하는 멀티모달 데이터셋을 쉽게 구축할 수 있습니다. 📂
- LLM이 영수증에서 직원 이름, 날짜, 금액 등 구조화된 정보를 추출하도록 프롬프트를 설계하고 출력 스키마를 적용합니다. 📝
- 정확성 평가자와 같은 내장 평가자를 활용하여 1-10점 척도로 출력의 정확성, 완전성, 근거를 평가하도록 맞춤 설정할 수 있습니다. 💯
- 다양한 LLM(예: Anthropic)을 대상으로 멀티모달 콘텐츠 처리 성능을 비교하여 최적의 모델을 선택할 수 있습니다. 🤖
- 실험 결과를 나란히 비교하고, 개별 트레이스에서 입력 이미지를 검사하며, 요약 통계를 통해 심층 분석이 가능합니다. 🔬
- 이 과정을 통해 모델 선택 및 프롬프트 개선에 대한 정보에 입각한 의사 결정을 내리고 품질 지표를 지속적으로 향상시킬 수 있습니다. ✨
데브허브 | DEVHUB | How to Run Multi-Modal Experiments in LangSmith Playground