데브허브 | DEVHUB | Why was this video suggested to you? Vector SearchWhy was this video suggested to you? Vector Search
- 임베딩은 데이터를 벡터로 표현하며, 의미론적으로 유사한 데이터는 벡터 공간에서 가깝게 위치합니다. 📊
- 개인화된 콘텐츠 추천은 사용자의 시청 기록, 선호도 등 복합적인 행동을 기반으로 개인 관심 벡터를 생성하여 이루어집니다. 🎯
- 사용자의 개인 관심 벡터는 시청한 콘텐츠 벡터들의 평균을 내거나, 최근 시청 콘텐츠에 더 가중치를 두는 지수 이동 평균(EMA) 방식으로 업데이트됩니다. 📈
- EMA 방식에서 '알파(alpha)' 값은 새로운 콘텐츠 시청 시 관심 벡터가 얼마나 빠르게 변화할지 결정하며, 적절한 값 설정이 중요합니다. ⚙️
- 실제 임베딩은 수백에서 수천 차원의 고차원 공간에서 작동하며, 이는 2D/3D 공간에서 발생할 수 있는 벡터 상쇄 문제를 줄여 의미론적 정확도를 높입니다. 🌌
- 사용자가 특정 콘텐츠에 '관심 없음'을 표시하면, 해당 콘텐츠의 벡터를 개인 관심 벡터에서 빼는 방식으로 추천 목록에서 제외할 수 있습니다. ➖
- 벡터 뺄셈 시 '베타(beta)' 값은 특정 콘텐츠를 추천에서 얼마나 강하게 제외할지 조절하는 역할을 합니다. 🚫
- 이러한 벡터 연산 기반의 개인화 추천 시스템은 YouTube, Netflix와 같은 대규모 플랫폼에서 핵심적으로 활용됩니다. 🚀
- 새로운 사용자를 위한 초기 관심 벡터 설정(콜드 스타트 문제)은 첫 시청 콘텐츠를 기반으로 하는 등 다양한 접근 방식이 있습니다. 🆕
- 모든 벡터 연산 후에는 벡터를 정규화하여 계산의 일관성과 효율성을 유지합니다. ✨