유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

[머신러닝+딥러닝 기초 강의] 28강. 대규모 언어 모델(LLM)로 텍스트 생성하기

한빛미디어

2025. 6. 30.

0

#ai
  • 대규모 언어 모델(LLM)은 텍스트 생성에 사용되며, 디코더 기반 모델 구조를 활용합니다. 🤖
  • 메타의 라마, 구글의 잼마, 마이크로소프트의 파이 등 다양한 오픈소스 LLM이 존재합니다. 🌐
  • 한국에서도 LG AI 연구원의 엑사원, 네이버의 하이퍼클로바X 등 오픈소스 모델이 등장하고 있습니다. 🇰🇷
  • 허깅페이스의 오픈 LLM 리더보드는 중단되었지만, LM 아레나가 유용한 대안으로 제시됩니다. 🏆
  • 엑사원 모델은 멀티쿼리 어텐션, 그룹 쿼리 어텐션, SwiGLU 함수, RMS 정규화 등의 기술을 적용했습니다. 💡
  • 토큰 디코딩 전략으로 온도 파라미터, 탑-K, 탑-P 방식이 사용되어 텍스트 생성의 자연스러움을 높입니다. 🌡️
  • OpenAI의 GPT 모델은 유료이지만 강력한 성능을 제공하며, 텍스트 생성에 활용할 수 있습니다. 💰

Recommanded Videos