- 대규모 언어 모델(LLM)은 텍스트 생성에 사용되며, 디코더 기반 모델 구조를 활용합니다. 🤖
- 메타의 라마, 구글의 잼마, 마이크로소프트의 파이 등 다양한 오픈소스 LLM이 존재합니다. 🌐
- 한국에서도 LG AI 연구원의 엑사원, 네이버의 하이퍼클로바X 등 오픈소스 모델이 등장하고 있습니다. 🇰🇷
- 허깅페이스의 오픈 LLM 리더보드는 중단되었지만, LM 아레나가 유용한 대안으로 제시됩니다. 🏆
- 엑사원 모델은 멀티쿼리 어텐션, 그룹 쿼리 어텐션, SwiGLU 함수, RMS 정규화 등의 기술을 적용했습니다. 💡
- 토큰 디코딩 전략으로 온도 파라미터, 탑-K, 탑-P 방식이 사용되어 텍스트 생성의 자연스러움을 높입니다. 🌡️
- OpenAI의 GPT 모델은 유료이지만 강력한 성능을 제공하며, 텍스트 생성에 활용할 수 있습니다. 💰