- 딥러닝 모델의 한계점을 찾아내는 프로젝트가 이루어지며, 다양한 LLM(대규모 언어 모델)의 능력이 심층적으로 분석됩니다 🔍.
- 연구자는 Rag를 이용하여 Google Drive와 Asana에 접근할 수 있는 AI 에이전트를 구축했습니다 🤖.
- GPT 모델(GPT-3.5, Fine-tuned Llama 3), Claude 등 다양한 LLM들을 사용하며 복잡성이 높은 요청을 처리하면서 한계점을 파악합니다 🚧.
- 라는 이를 기반으로 개발된 자동화된 LLM 테스트 프레임워크가 제안되며, 새로운 LLM 모델들의 효율성을 객관적으로 평가할 수 있도록 지원할 것입니다 📊.