- 인터넷 연결 문제에 대한 사과와 함께 시작, 연결 개선 계획 언급 📶.
- LLM이 생각하는 방식에 대한 이해를 목표로 하며, 이전 강의 내용 복습 🔄.
- LLM은 토큰 예측 기반이므로 문법적으로 옳지만 의미 없는 답변을 할 수 있음을 지적 🤔.
- 수학 문제 해결을 위해 모델에 수학적 맥락을 학습시키는 Fine-tuning 방법 제시 ➕.
- Chain of Thought를 통해 모델이 단계별 사고 과정을 학습하도록 유도 💡.
- Reinforcement Learning을 통해 더 나은 답변을 유도하는 평가 시스템 도입 제안 🏆.