- 5원은 멀티스텝 추론을 암묵적으로 보여주며, 체인 오브 쏘트(COT) 프롬프팅을 활용해 중간 추론 과정을 거쳐 답변을 생성합니다. 🧠
- 5원 미니는 1000억 개 미만의 파라미터로 구성되어 있으며, 이는 모델 크기가 추론 능력의 절대적인 기준이 아님을 시사합니다. 🤯
- 5원은 프리트레이닝, 포스트트레이닝, 추론 시 컴퓨팅 자원을 균등하게 배분하여 성능을 극대화합니다. ⚖️
- 소넷은 안전성(Safety)을 중시하는 엔트로픽의 철학이 반영된 모델로, 인간 친화적인 답변을 생성합니다. 😇
- 소넷은 액티베이션 레벨 조정을 통해 모델의 출력을 제어할 수 있음을 보여주며, 이는 테스트 타임 스케일링에 활용될 수 있습니다. 🎛️