베
베스핀글로벌
April 11, 20251회
sLLM, Gemma 파인튜닝 예

간단 소개
sLLM, Gemma 모델을 한국어 요약에 특화되도록 파인튜닝하는 과정을 소개하고, QLoRA 기법을 활용하여 Colab 환경에서 효율적으로 학습하는 방법을 설명합니다.
AI Summary
- Gemma 모델 소개 및 특징
- Google의 경량 개방형 모델 제품군인 Gemma는 Gemini 모델과 동일한 연구 및 기술로 구축됨
- Gemma 2B와 Gemma 7B 두 가지 유형으로 제공되며, 사전 학습 및 instruction-tuned 모델을 포함
- 책임감 있는 AI 툴킷을 통해 안전한 AI 애플리케이션 제작을 지원하고, Kera JAX, PyTorch, TensorFlow 등 주요 프레임워크와 NVIDIA GPU, 구글 클라우드 TPU 등 다양한 하드웨어를 지원
- Gemma 파인튜닝 과정
- 한국어 요약 모델을 만들기 위해 naver-news-summarization-ko 데이터셋을 활용하여 Gemma 모델을 파인튜닝하는 과정 설명
- QLoRA 기법을 사용하여 Colab 환경에서 파인튜닝을 진행하고, 학습용 프롬프트 조정 및 SFTTrainer를 사용한 학습 과정 제시
- 학습된 LoRA weight를 원래 모델과 병합하여 Fine-tuned 모델을 생성하고, 이를 활용하여 한국어 요약 모델을 추론하는 과정 소개
Next Feeds
OpenSearch Analyzer를 활용한 검색기능 알아보기
OpenSearch의 특징과 Analyzer를 활용한 검색 기능, 그리고 카카오페이손해보험의 활용 사례를 소개합니다.
OpenSearchAnalyzer검색 엔진인덱싱카카오페이손해보험
2025. 4. 11.
카카오페이

모두가 AI 로켓에 올라타도록, 당근 운영실이 AI로 일하는 법
당근 운영실의 AI 전환 사례: 문화 구축, 조직 구조 혁신, 직군을 초월한 AI 몰입을 통해 문제 해결 능력을 고도화하고 있습니다.
AI 전환워킹그룹실행 문화조직 혁신LLM
2025. 4. 11.
당근

당신의 CPU는 열심히 일하고 있나요?
쿠버네티스 CPU 리소스 관리 방법과 CPU 상한 설정 제거에 따른 성능 변화를 분석하고, 프로젝트 환경에 따른 최적 설정 방안을 제시합니다.
쿠버네티스CPU 리소스CFSCPU 상한성능 최적화
2025. 4. 11.
LY Corp

대용량 트래픽을 견디는 서버 만들기 — Rust 기반 게이트웨이 구축
Node.js 기반 게이트웨이의 대량 트래픽 문제를 Rust 기반 Apollo Router로 해결하고 성능을 개선한 여정을 담고 있습니다.
RustApollo RouterGraphQL게이트웨이성능 최적화
2025. 4. 10.
크리에이트립

UX 리서처가 양말 파는 사장님이 된 이유
토스 UX 리서처가 양말 판매 사업을 통해 B2B 서비스 사용자의 고충을 이해하고 서비스 개선에 기여한 경험을 공유합니다.
UX 리서치B2B 서비스사용자 경험사업자토스페이먼츠
2025. 4. 10.
토스

의존성 그래프를 활용한 프로젝트 시각화 — 사이드 이펙트 한눈에 파악하기
의존성 그래프를 활용한 프로젝트 시각화로 사이드 이펙트 파악 및 코드 파악 시간 단축 방법을 제시한다.
의존성 그래프사이드 이펙트시각화코드 파악Dependency Cruiser
2025. 4. 10.
당근