유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

[KAIST, MARKR.AI 이승유 X 테디노트] Reasoning 모델 & Test Time Scaling 심층탐구🔥

테디노트 TeddyNote

2025. 4. 15.

0

#ai
  • 5원은 멀티스텝 추론을 암묵적으로 보여주며, 체인 오브 쏘트(COT) 프롬프팅을 활용해 중간 추론 과정을 거쳐 답변을 생성합니다. 🧠
  • 5원 미니는 1000억 개 미만의 파라미터로 구성되어 있으며, 이는 모델 크기가 추론 능력의 절대적인 기준이 아님을 시사합니다. 🤯
  • 5원은 프리트레이닝, 포스트트레이닝, 추론 시 컴퓨팅 자원을 균등하게 배분하여 성능을 극대화합니다. ⚖️
  • 소넷은 안전성(Safety)을 중시하는 엔트로픽의 철학이 반영된 모델로, 인간 친화적인 답변을 생성합니다. 😇
  • 소넷은 액티베이션 레벨 조정을 통해 모델의 출력을 제어할 수 있음을 보여주며, 이는 테스트 타임 스케일링에 활용될 수 있습니다. 🎛️

Recommanded Videos