데브허브 | DEVHUB | What Is LangSmith? Explained in 5 MinutesWhat Is LangSmith? Explained in 5 Minutes
- LangSmith는 LLM 애플리케이션 및 에이전트의 성능을 개발 주기 전반에 걸쳐 향상시키는 상업 플랫폼으로, 관찰성, 평가, 프롬프트 엔지니어링을 핵심 기능으로 제공합니다. 🚀
- LangChain과 잘 연동되지만, 어떤 에이전트 프레임워크나 프레임워크 없이도 작동하도록 설계된 유연한 솔루션입니다. 🧩
- 관찰성(Tracing) 기능: 에이전트의 추론 및 동작 방식을 이해하기 위해 워크플로우의 각 단계를 자동으로 로깅하며, 'Run tree view'로 디버깅하고 병목 현상을 식별할 수 있습니다. 🕵️♀️
- 'Threads tab'은 다중 턴 대화 기록을 그룹화하여 사용자 참여 방식을 쉽게 파악할 수 있도록 돕습니다. 💬
- 'Monitoring tab'은 볼륨, 성공률, 지연 시간 등 내장 차트를 제공하며, 응답 간결성, 유용성, 환각과 같은 정성적 지표를 위한 사용자 정의 평가자를 정의할 수 있습니다. 📊
- 품질 저하 또는 지연 시간 급증 시 PagerDuty 또는 웹훅을 통해 사전 예방적 알림을 설정할 수 있으며, 생산 트레이스를 필터링하여 테스트 스위트를 구축하는 자동화 규칙을 지원합니다. 🚨
- 평가(Evaluation) 기능: 'Annotation cube'는 트레이스를 감사하고 피드백을 남기거나 테스트 스위트의 예시로 추가할 수 있는 전용 공간을 제공합니다. 📝
- 데이터셋 및 실험 기능을 통해 수동 생성, AI 증강, 또는 생산 트레이스에서 가져온 대표 데이터셋을 큐레이션하여 에이전트 성능을 지속적으로 측정하고 추적할 수 있습니다. 🧪
- SDK 또는 UI를 통해 실험을 실행할 수 있어 개발자뿐만 아니라 비기술적 이해관계자도 테스트 과정에 참여할 수 있으며, 실험 결과를 중앙 집중화하여 성능 추세를 쉽게 분석하고 변경 사항의 영향을 명확하게 파악할 수 있도록 실험을 나란히 비교하는 기능을 제공합니다. 🔬
- 프롬프트 엔지니어링(Prompt Engineering) 기능: 'Prompt playground'는 다양한 모델을 테스트하고, 문구를 조정하며, 변경 사항이 응답에 미치는 영향을 확인할 수 있는 스크래치패드를 제공합니다. ✍️
- 'Prompt canvas' 도구를 통해 프롬프트에 대한 피드백을 제공하고 AI 최적화 버전을 얻을 수 있어 팀원 모두가 전문 프롬프터가 될 수 있도록 돕습니다. 🎨
- 개선된 프롬프트는 중앙 집중식 프롬프트 라이브러리에 저장하여 팀원들이 재사용하고 개선할 수 있으며, 시간 경과에 따른 변경 사항을 추적하는 커밋 기록도 제공합니다. 📚