버
버즈빌
June 16, 20161회
Content clustering using word2vec

간단 소개
word2vec을 사용하여 콘텐츠 클러스터링을 구현하고, 사용자 클릭 데이터를 기반으로 콘텐츠 유사성을 분석하여 큐레이션 시스템을 구축하는 방법.
AI Summary
- word2vec을 활용한 콘텐츠 클러스터링
- Buzzvil의 Honeyscreen UX 개선을 위해 머신러닝 기반 콘텐츠 클러스터링을 시도.
- word2vec은 단어 간의 의미적 유사성을 벡터 공간에 표현하는 효과적인 NLP 기술.
- word2vec 모델 학습 및 결과 분석
- 사용자 클릭 이력을 바탕으로 콘텐츠 ID를 문장으로 구성, gensim word2vec 모델 학습.
- 콘텐츠 간 유사도는 벡터의 코사인 유사도로 측정, 높은 유사도(>0.95)는 동일 카테고리로 판단.
- 모델 개선 및 활용 가능성
- 태그 데이터를 활용한 정확도 테스트에서 '웹툰', '뷰티' 태그의 정확도는 각각 80%, 75%.
- 클릭률(CTR)이 높은 콘텐츠는 유사 콘텐츠 또한 높은 CTR을 보임.
- 향후 TF-IDF, paragraph2vec 등 다른 머신러닝 방법과 결합하여 콘텐츠 큐레이션 시스템 구축 가능.
Next Feeds

허니스크린 포인트 시스템 마이그레이션을 위한 MySQL 성능 최적화
허니스크린 포인트 시스템 마이그레이션을 위한 MySQL 성능 최적화 과정과 팁을 공유합니다. 대량 업데이트, 인덱스 활용, 쿼리 최적화, 데이터 백업 전략을 다룹니다.
MySQL성능 최적화마이그레이션커버링 인덱스DynamoDB
2016. 5. 23.
버즈빌
서버 비용을 70%나 줄인 온디맨드 리사이징 이야기
비트윈은 온디맨드 리사이징 아키텍처 변경 및 WebP, Skia 적용으로 서버 비용을 70% 절감했습니다.
온디맨드 리사이징SkiaWebPAWS비용 절감
2016. 5. 16.
VCNC

AWS DynamoDB at Buzzvil
버즈빌은 허니스크린 포인트 시스템을 위해 DynamoDB를 도입하고 테이블 구조 개선 및 데이터 일관성 문제를 해결했습니다.
DynamoDB포인트 시스템스케일링Conditional write데이터 일관성
2016. 3. 4.
버즈빌

AWS DynamoDB at Buzzvil
Buzzvil Honeyscreen 포인트 시스템의 DynamoDB 전환 및 테이블 설계, 문제 해결 과정 및 GSI 활용을 설명합니다.
DynamoDBHoneyscreenNoSQLAWSGSI
2016. 3. 4.
버즈빌

Weighted Random Shuffling Algorithms
Buzzvil은 가중치 랜덤 셔플링 알고리즘(WRS)을 사용하여 광고 및 콘텐츠 제공을 최적화하고, 다양한 구현 방법과 최적화 팁을 제시합니다.
WRSCTRBinary Search TreeBuzzAd최적화
2016. 2. 11.
버즈빌

Weighted Random Shuffling Algorithms
Weighted Random Shuffling 알고리즘의 개념, 구현 방법, 최적화 전략을 설명하고, 실제 프로덕션 환경에서의 활용 팁을 제공합니다.
Weighted Random ShufflingWRS가중치이진 탐색 트리최적화
2016. 2. 10.
버즈빌