- 랭체인에서 Langraph 에이전트 평가를 더 쉽게 수행할 수 있도록 Langraph Studio에서 직접 평가를 실행하는 기능이 추가됨. 🧪
- 개발자가 아닌 사용자도 Langraph 에이전트의 다양한 구성을 쉽게 테스트할 수 있음. 👩💻➡️👩💼
- Langraph Studio의 '실험 실행' 버튼을 통해 데이터 세트를 선택하고 평가를 시작할 수 있음. 🚀
- 데이터 세트는 입력 주제와 참조 소스 문서로 구성되며, 평가자는 데이터 세트에 고정되어 평가 기준을 설정함. 🗂️
- Langraph Studio UI에서 코드 없이 그래프 구성을 수정하고 평가를 실행하여 빠른 반복 개발이 가능함. ⚙️
- 실험 결과는 Langsmith 데이터 세트 보기에서 확인하고 이전 평가와 비교할 수 있음. 📊