하
하이퍼커넥트
November 28, 20252회
왜 막상 배포하면 효과가 없지? 타겟 지표에 맞는 ML모델 train/eval 설계하기

간단 소개
ML 모델이 실제 서비스에서 효과를 내기 위해 비즈니스 목표에 맞는 학습 및 평가 지표를 설계하고, 데이터의 통계적 특성을 고려하여 confounder 영향을 최소화하는 과정을 설명합니다.
AI Summary
- ML 모델 배포 실패 원인 및 문제 정의
- ML 모델이 벤치마크에서 좋은 성능을 보여도 실제 서비스에서 비즈니스 목표와 타겟 지표가 불일치하면 효과가 없을 수 있음.
- 하이퍼커넥트 사례: 아이템의 여러 속성 중 전환율을 높일 대표 속성을 예측하는 ML 모델 개발 목표.
- 기존 방식(랜덤 exploration)의 한계: 새로운 아이템/속성 발생 시 기회비용 발생 및 시간 소요.
- 학습 목표 설계 및 데이터셋 구축
- 초기 학습 방식(속성별 전환율 예측)은 추천 로직에 의한 유저-아이템 종속성 및 confounder 문제로 실패.
- user-wise ranking 및 item-wise ranking 방식도 아이템 전체 정보 영향, hidden variable(시간) 등의 문제로 한계.
- 최종적으로 randomized 데이터를 활용한 item-wise attribute CR ranking 방식으로 confounder 영향을 제거하고 학습 목표를 설정.
- 비즈니스 임팩트 중심의 오프라인 평가
- 초기 평가 지표(Mean SRCC, Top-1 accuracy)는 observed CR의 노이즈와 비즈니스 임팩트 미반영 문제로 한계.
- 새로운 평가 지표로 relative mean CR lift를 도입하여 실제 전환율 상승을 직접 가늠.
- maximization bias를 억제하기 위해 Double DQN 아이디어를 활용하여 optimal 성능의 lowerbound를 추정.
- 오프라인 평가 후 온라인 A/B 테스트를 통해 유의미한 핵심 지표 개선 확인 및 성공적 배포.
Next Feeds

경험이 쌓일수록 똑똑해지는 네이버 통합검색 LLM Devops Agent
네이버 통합검색의 LLM Devops Agent를 활용한 장애 대응 프로세스 개선 방안을 소개합니다.
네이버 통합검색LLM AgentDevops Agent장애 대응NAVER ENGINEERING DAY
2025. 11. 27.
Naver d2

누구나 리서치 하는 시대, UX리서처의 생존법
UX리서처가 AI 시대에 제품 개발의 아이디어, 개선, 성장 단계별로 사용자 중심의 UX 리더십을 발휘하는 생존 전략을 제시한다.
UX리서처제품 개발사용자 관점AI 리서치UX 리더십
2025. 11. 27.
토스

매경AX의 생성형 AI 기반 오디오 팟캐스트 자동 생성 시스템 도입 여정
매경AX가 AWS와 협력하여 Amazon Bedrock 기반의 생성형 AI 팟캐스트 자동 생성 시스템을 구축하고, 환각 방지 및 운영 효율성을 달성한 여정.
매경AXAI 팟캐스트Amazon Bedrock생성형 AI환각 방지
2025. 11. 27.
AWS

블루닷(BLUEDOT)의 AWS Elemental과 EC2 GPU AMI를 이용한 실시간 4K AI 비디오 업스케일링 아키텍처
블루닷은 AWS Elemental 및 EC2 GPU AMI를 활용하여 실시간 4K AI 비디오 업스케일링 솔루션을 제공, 미디어 산업의 영상 품질과 효율성을 혁신합니다.
블루닷AI 업스케일링AWS Elemental실시간 스트리밍4K 비디오
2025. 11. 27.
AWS

The Journey to Daangn Pay’s AI-Powered FDS: From Building a Rule Engine to Applying LLMs
제공된 본문이 HTTP 500 오류 메시지이므로, 제목에 기반하여 Daangn Pay의 AI 기반 FDS 여정을 다룹니다.
Daangn PayAI-Powered FDSRule EngineLLMsFraud Detection
2025. 11. 27.
당근

테스트도 하고 신상 폰도 구경하고~ 여기어때 디바이스룸
여기어때는 구성원들의 업무 효율과 몰입도 향상을 위해 다양한 기기 테스트 및 체험이 가능한 '디바이스룸'을 운영합니다.
디바이스룸여기어때테스트 환경업무 효율조직문화
2025. 11. 27.
여기어때