[무료] 바닥부터 만들기 1시간 핵심 정리! [홍정모 연구소]
- 대형 언어 모델(LLM) 제작 기술이 대중화됨 🚀
- 무료로 사용 가능한 LLM 공개로 비용 부담 해소 🎉
- LLM 제작 기술은 더 이상 특별한 기술이 아님 🎓
- LLM 제작 관련 자료 및 교재 증가로 학습 접근성 향상 📚
- LLM 기반 AI 에이전트 개발의 핵심은 LLM임 🤖
- LLM 훈련은 사전 훈련(Pre-training)과 미세 조정(Fine-tuning) 단계로 구성됨 ⚙️
- LLM의 지식 범위, 정확성, 시의성 향상을 위한 다양한 방법 존재 💡
- LLM 훈련 데이터 준비가 가장 어려운 과정이며, 데이터 가공에 노력 필요 🧹
- 토큰화(Tokenization)를 통해 문자열을 숫자로 변환하여 뉴럴 네트워크에 입력 🔢
- 데이터 로더(Data Loader)를 통해 뉴럴 네트워크에 데이터를 효율적으로 입력 DataLoader 🚄
- Transformer 구조와 Self-Attention 메커니즘 이해 중요 🧠
- 마스크(Mask)를 사용하여 미래의 단어를 가리고 훈련 효율 증대 🎭
- GPU 사용을 통한 훈련 속도 향상 가능, CPU 사용 시 데이터 양 조절 필요 💻
- 에폭(Epoch) 수 조절을 통해 훈련 시간 단축 가능 ⏱️