네
네이버DnA팀
February 14, 20251회
생성형 검색 (RAG) 평가의 최근 트렌드

간단 소개
생성형 검색(RAG) 평가의 최신 트렌드를 분석하고, LLM Ops 플랫폼, RAG 평가 지표, Long Context와 RAG의 비교를 다룬다.
AI Summary
- LLM Ops 평가 플랫폼의 등장
- LangSmith와 Weights&Biases 같은 플랫폼이 AI 모델 및 평가 데이터셋 등록, 지표 기반 평가를 제공.
- 다양한 오픈소스 프로젝트 존재.
- RAG 평가 지표의 다양화 및 세분화
- RAGAs 프레임워크가 사실상 표준으로 자리매김.
- 컨텍스트 품질(컨텍스트 정확도, 컨텍스트 재현율)과 답변 품질(충실도, 답변 관련성)을 측정.
- 인용 과정의 오류를 평가하는 방법론 등장.
- Long Context (LC) vs RAG 비교
- 단순 요약 질문에는 LC가, 정보가 흩어진 경우 RAG가 유리.
- LC는 위키피디아 기반 질문에, RAG는 대화형 질문에 강점.
- 사실 기반 질문에는 LC, 개방형 질문에는 RAG가 유사한 성능.
Next Feeds

LLM 앱의 제작에서 테스트와 배포까지, LLMOps 구축 사례 소개
LLM 앱 개발, 테스트, 배포를 위한 LLMOps 구축 사례 소개: LINE GAME PLATFORM의 경험을 바탕으로 LLMOps의 정의, MLOps와의 차이점, 구축 과정, 개선점을 설명합니다.
LLMOpsLLMMLOpsRAG프롬프트 엔지니어링
2025. 2. 14.
LY Corp

데브시스터즈의 장애 대응 원칙과 방법
데브시스터즈의 장애 대응 원칙, 알람 티어링 체계, 효과적인 장애 대응 방법 및 포스트모템 절차를 상세히 설명합니다.
장애 대응알람 티어링FRT포스트모템DevOps
2025. 2. 13.
데브시스터즈
[#5 LLM Tutorial With RAG] LLM은 학습할 데이터도 스스로 만들 수 있습니다!
LLM을 활용해 학습 데이터를 자동 생성하는 튜토리얼. RAG 시스템 구축 핵심 단계 설명.
LLMRAGLangChain프롬프트 엔지니어링데이터 자동 생성
2025. 2. 12.
현대자동차
AWS re:Invent 2024 Recap: Database, Storage
AWS re:Invent 2024에서 공개된 Amazon Aurora DSQL과 Amazon S3 Tables의 주요 특징과 활용 방안을 소개한다.
AWS re:InventAmazon Aurora DSQLAmazon S3 Tables데이터베이스클라우드 스토리지
2025. 2. 12.
카카오페이

SPA 환경에서의 버전 업데이트를 위한 모두싸인의 최신 버전 업데이트 기능 구현기
SPA 환경에서 버전 업데이트 문제를 해결하고, 사용자에게 최신 버전을 제공하기 위한 모두싸인의 기술적 해결 방안 및 개발 과정 소개.
SPA버전 업데이트ReactViteAWS S3
2025. 2. 12.
모두싸인

개발 생산성 높이는 10가지 Git 필수 명령어
Git의 효율적인 활용을 위한 필수 명령어 10가지와 활용법을 소개하여 개발 생산성 향상을 돕는다.
Gitrebasereflogworktreebisect
2025. 2. 12.
인포그랩