L
LY Corp
June 19, 20241회
오픈챗 해시태그 예측을 위한 다중 레이블 분류 모델 개발하기

간단 소개
오픈챗 해시태그 예측을 위한 다중 레이블 분류 모델 개발 과정과 성능 향상 기법을 소개합니다.
AI Summary
- 오픈챗 해시태그 예측 모델 개발
- 오픈챗 이름과 설명글을 기반으로 해시태그를 예측하는 다중 레이블 분류 모델 개발
- 사용자에게 적절한 해시태그를 제시하여 오픈챗 생성을 돕고 검색 효율성을 향상시키는 것을 목표
- 모델링 및 학습 과정
- Hugging Face Transformers를 활용하여 모델 구현, 다중 언어 모델을 사용하여 여러 언어 처리
- 변형된 CCE 손실 함수를 사용하여 학습, MMR 기법을 도입하여 추천 결과의 다양성을 확보
- 정밀도와 재현율을 평가 지표로 사용, 정성 평가를 통해 최종 모델 결정
- 실시간 제안 및 오프라인 태깅
- 실시간 추론 시나리오에서 다양한 입력 시점에 따른 모델 개선, 데이터 증강을 통해 성능 향상
- 오프라인 태깅에서는 임계치 파라미터를 도입하여 신뢰도 높은 출력만 필터링, 광고 매칭 정확도 향상
Next Feeds

엔지니어의 AI 학회 참관기 - ITS(Intelligent Transport Systems) World Congress 2022
ITS World Congress 2022 참관을 통해 AI가 실제 산업 현장에서 어떻게 적용되고 있는지, 그리고 그 한계는 무엇인지 살펴본 내용입니다.
AIITSLidarGPS관제시스템
2024. 6. 18.
현대자동차

AWS Lambda 를 활용한 Luft 스케일링
AWS Lambda를 활용한 Luft 스케일링 시도와 결과 분석: 람다의 장단점을 고려한 하이브리드 방식의 스케일링 전략 모색.
AWS LambdaLuft스케일링OLAP서버리스
2024. 6. 18.
AB180
Google Cloud Next 2024 참관 후기 2편 - Google Cloud Serverless for Java developer
Google Cloud Next 2024에서 소개된 Serverless 기술과 Java 개발자를 위한 Cold Start 완화 전략을 제시합니다.
ServerlessCloud RunCold StartJavaGCP
2024. 6. 18.
카카오페이
보이스피싱 애플리케이션 분석 2부
보이스피싱 앱의 동작 방식, 정보 탈취, 악성 행위 분석을 통해 보안 위협을 강조하고, 사용자 주의를 환기합니다.
보이스피싱악성 앱정보 탈취전화 가로채기개인 정보
2024. 6. 18.
NHN

Salesforce - Event Driven 기반으로 고객정보 빠르게 전달하자
Salesforce CDC를 활용한 Event Driven 아키텍처로 고객 정보 실시간 전달 및 시스템 확장성 확보 방안을 제시합니다.
SalesforceEvent DrivenCDCPub/SubUUID
2024. 6. 17.
현대자동차

Phi-3 Technical Report Review
Microsoft의 Phi-3 모델은 작은 크기에도 불구하고 뛰어난 성능을 보이며, 모바일 기기에서 LLM 구동 가능성을 제시한다.
Phi-3LLMSLMOnDeviceAI모델 양자화
2024. 6. 17.
현대자동차