N
Naver d2
July 17, 20253회
레거시 GPU에 날개 달기: 극한의 서빙 최적화 가이드

간단 소개
BERT 기반 SPLADE 모델의 실시간 서빙 최적화 방법과 FlashTokenizer 개발 배경 및 성능을 소개합니다.
AI Summary
- SPLADE 모델 서빙 최적화
- BERT 기반 SPLADE 모델의 대규모 실시간 서비스를 위한 최적화 방법 소개
- FlashTokenizer 개발 배경 및 성능 강조
- 최적화 기법
- 모델 단순화, 추론 최적화(기본 및 고급), 전/후 처리 최적화 등 다양한 기법 활용
- 실시간 서빙을 위한 모델 추론 최적화 필요성에 대한 강조
- NAVER ENGINEERING DAY 소개
- 네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 소개
- 실무 개발 경험 및 기술 트렌드 공유의 장
Next Feeds

최신 논문 분석을 통한 LLM의 환각 현상 완화 전략 탐구
LLM 환각 현상 완화를 위한 최신 논문 분석: 원인, 전략, 그리고 미래 LLM 발전 방향 제시
LLM환각RLHFRAG미세조정
2025. 7. 17.
한글과컴퓨터

“AI가 문제 냈어요?” 출제자 PO가 직접 답해드립니다 | 언더커버 사일로 비하인드 1화: 인플로우 사일로
토스 인플로우 사일로의 유저 유입 전략과 '언더커버 사일로' 문제 출제 비하인드 스토리를 PO가 직접 설명합니다.
인플로우 사일로유저 그로스바이럴 마케팅언더커버 사일로토스
2025. 7. 17.
토스

당근 데이터 디스커버리 구축기: DataHub와 DataWiki로 여는 데이터 탐색의 첫걸음
당근은 DataHub와 DataWiki를 구축하여 데이터 디스커버리 환경을 개선하고, 챗봇 인터페이스를 통해 데이터 접근성을 높이려 한다.
DataHubDataWiki데이터 디스커버리메타데이터BigQuery
2025. 7. 17.
당근

일본 소도시 여행의 감성을 디자인하다: 마케팅 굿즈 제작 그리고 개선
여기어때는 일본 소도시 여행 마케팅을 위해 굿즈를 제작하고 개선하며, 콜라보 콘텐츠와 쿠폰을 통해 여행 경험을 확장합니다.
일본 소도시마케팅 굿즈유튜버 콜라보여행 경험여기어때
2025. 7. 17.
여기어때

Amazon Bedrock을 활용한 Omelet의 경로 최적화 AI 에이전트, TOAST
Amazon Bedrock 기반 Omelet의 TOAST는 자연어 기반 경로 최적화 AI 에이전트로, 복잡한 최적화 기술을 쉽게 활용하도록 지원한다.
Amazon BedrockAI 에이전트경로 최적화자연어 처리Omelet
2025. 7. 16.
AWS

‘러닝 쉐어’의 새로운 실험, 토스가 두뇌 서바이벌을 만든 이유
토스의 '러닝 쉐어' 실험과 두뇌 서바이벌 콘텐츠 제작 배경, 그리고 웹 페이지 오류 발생에 대한 내용.
토스러닝 쉐어두뇌 서바이벌실험오류
2025. 7. 16.
토스