- OpenEvals는 LLM 앱 평가를 위한 오픈소스 패키지입니다. 🚀
- LLM을 활용하여 앱 출력물의 품질을 평가하는 'LLM as a judge' 방식을 지원합니다. ⚖️
- 사용자 정의 가능한 프롬프트와 점수 체계를 제공하여 유연성을 높였습니다. ⚙️
- 다양한 모델 (OpenAI, Anthropic 등)과 프로그래밍 언어 (Python, JavaScript)를 지원합니다. 🐍
- 몇 가지 예시를 통해 LLM 평가자에게 명확한 기준을 제공합니다. 💡
- 앱의 성능 저하를 방지하고, 팀 협업을 원활하게 합니다. 🤝
- 오픈소스로 공개되어 커뮤니티 기여를 장려합니다. 🤝