버
버즈빌
January 19, 20211회
그리디 알고리즘을 이용한 중복 콘텐츠 클러스터링

간단 소개
그리디 알고리즘을 활용한 중복 콘텐츠 클러스터링 방법론과 버즈빌의 실제 적용 사례, 그리고 향후 개선 방향을 제시합니다.
AI Summary
- 중복 콘텐츠 클러스터링 문제 정의
- 버즈빌은 콘텐츠 퍼블리셔들의 콘텐츠를 크롤링하여 제공하며, 중복 콘텐츠를 효율적으로 관리해야 함.
- 중복 콘텐츠 분류 후 대표 콘텐츠를 선택하는 두 단계로 문제 해결.
- 클러스터링 알고리즘 및 원칙
- 콘텐츠 간 중복 관계를 비가중 그래프로 표현하고, 그래프 클러스터링을 통해 대표 콘텐츠를 선정.
- 필수 원칙: 각 노드는 대표이거나 대표 노드와 이웃해야 하고, 대표 노드끼리는 이웃하면 안 됨.
- 약한 원칙: 가능한 최소 또는 최대 수의 클러스터를 생성 (각각 적은 수 대표, 많은 수 대표).
- 그리디 알고리즘 적용 및 개선
- 약한 원칙 기반으로 그리디 알고리즘을 적용하여 클러스터링 수행.
- 배치 프로세스의 단점을 개선하기 위해 매트릭 트리를 이용한 스트리밍 프로세스 제안.
- 찬탈 허용 여부에 따라 알고리즘 조정.
Next Feeds

강화학습으로 더 재미있는 게임 만들기
강화학습을 활용하여 게임 밸런싱을 자동화하고, 유저 경험을 정량적으로 분석하여 게임 개발 및 운영 효율성을 향상시킨 사례를 소개합니다.
강화학습게임 밸런싱PPO퍼즐 게임자동화
2021. 1. 18.
데브시스터즈

두근두근 컬리의 면접, 팀에서 성장하기
컬리 입사 과정과 팀 내 성장 경험을 공유하며, DDD 적용, 기술 공유 문화, 코드 리뷰, 실수 관리 등 개발 문화 강조.
컬리면접DDD코드 리뷰기술 공유
2021. 1. 12.
컬리

ReactNative와 함께하는 서비스 개발부터 배포까지
올리브영 인마이백 앱 개발에 ReactNative를 도입한 배경, 개발 및 배포 전략, 사용 경험을 요약합니다.
ReactNative인마이백CodePush크로스플랫폼올리브영
2021. 1. 5.
올리브영

데이터 분석 라이브러리 개발기 (2) - 통합 테스팅과 문서화를 동시에 잡는 방법
MinIO, Pytest, Doctest를 활용하여 데이터 분석 라이브러리의 테스트와 문서화를 동시에 잡는 효율적인 개발 환경 구축 사례.
PytestMinIODoctestfixture데이터 분석
2020. 12. 4.
데브시스터즈

Banksalad Product Language는 어떻게 디자인되었나요?
뱅크샐러드 Product Language(BPL)의 디자인 과정, 핵심 규칙, 도입 효과 및 향후 계획을 설명합니다.
Product LanguageDesign SystemBPLFigma컴포넌트
2020. 12. 3.
뱅크샐러드

데이터 분석 라이브러리 개발기 (1)
PySpark SQL 기반 데이터 분석 환경 개선을 위해 DevPlay Analytics 라이브러리를 개발하고 적용한 과정 및 효과를 설명합니다.
PySpark데이터 분석라이브러리SQLDevPlay Analytics
2020. 11. 27.
데브시스터즈