L
LY Corp
August 29, 20251회
오픈챗 메시지들로부터 트렌딩 키워드 추출하기

간단 소개
오픈챗 메시지에서 트렌딩 키워드를 추출하고 품질을 향상시키는 통계적 기법과 향후 LLM 활용 방안을 제시합니다.
AI Summary
- 오픈챗 트렌딩 키워드 추출 배경
- 오픈챗 메인 화면의 낮은 재방문율과 주요 KPI인 메인 화면 방문자 수 증대 필요성 대두
- 채팅방 대신 메시지 콘텐츠 노출을 통해 마이크로 블로그 서비스처럼 활성화를 유도하고자 함
- 메시지 단건의 한계 극복을 위해 유사 주제 메시지들을 묶어 콘텐츠화하는 방식 채택
- 트렌딩 키워드 선정 및 품질 향상
- 빈도 기반으로 급격한 빈도 증가 단어 선정, Z-테스트 통계량 활용 및 노이즈 효과 감안
- MinHash 기반 메시지 중복 제거로 텍스트 중복 문제 해결, 클러스터 내 다양성 지표 활용
- NPMI 기반 부적절 키워드 필터링 및 MMR 방식으로 상위 키워드 다양성 확보
- 향후 과제 및 결론
- LLM을 활용한 트렌딩 리포트 생성 및 타 서비스와의 연계 가능성 모색
- 사용자 중심의 콘텐츠 제공을 통해 오픈챗 서비스 활성화에 기여하고자 함
Next Feeds

Kanana 언어모델에 추론 기능 붙여보기 (feat. Kanana-1.5)
카카오 Kanana 언어모델에 추론 기능을 강화하기 위한 SFT, RL, Staged RL 실험 과정 및 결과를 분석하고, 성능 향상 전략을 제시합니다.
KananaLLM추론SFT강화학습
2025. 8. 29.
카카오

토스 피플 : 새로운 길을 만들 땐 내 선택을 믿는다
토스 이현정님의 커리어 여정과 토스에서의 B2B, B2C 플랫폼 성공 경험, 그리고 빠른 판단과 실행의 중요성을 강조합니다.
UX/UIB2B 플랫폼B2C 플랫폼사용자 경험빠른 실행
2025. 8. 28.
토스

외부 백엔드 커뮤니티와 함께 한 올리브영의 SpringCamp 2025 참가 후기
올리브영이 SpringCamp 2025에 참가하여 물류 시스템 개선 경험을 공유하고, 개발자들과 소통하며 긍정적인 교류를 이뤘습니다.
SpringCamp물류 시스템KafkaRedis개발 문화
2025. 8. 28.
올리브영

Amazon EKS Add-on, Falco와 함께 Kubernetes 런타임 보안 확보하기
Amazon EKS Add-on과 Falco를 활용하여 Kubernetes 런타임 보안을 확보하고, CloudWatch Logs로 통합 모니터링하는 방법을 제시합니다.
EKSFalcoKubernetes런타임 보안CloudWatch Logs
2025. 8. 28.
AWS

데이터 쌓기만 하면 뭐하나? ‘어떻게 볼지’를 모르는데 – LG전자의 Agentic AI 기반 인사이트 추출 시스템 개발기
LG전자는 Agentic AI 기반 인사이트 추출 시스템을 통해 데이터 접근성을 높이고 마케팅 효율성을 극대화했습니다.
Agentic AI인사이트 추출데이터 드리븐 마케팅Text2SQL자동화
2025. 8. 28.
AWS

토스 피플: 50살, 엔지니어로 살아남는 법
50대 엔지니어 고동일님의 커리어 여정과 토스 합류 이유, 그리고 엔지니어로 살아남는 비결을 담은 인터뷰.
엔지니어커리어토스게임 개발광고 기술
2025. 8. 28.
토스