- LLM은 통계적 패턴 기반으로 논리적인 응답을 생성하며, 이는 정답 도달 과정을 보여주는 능력과 관련됨. 🧠
- 리즈닝 모델은 긴 출력을 통해 기존에 풀지 못했던 문제를 해결하고 문제 해결 범위를 넓힘. 🗣️
- LM은 이전 출력을 수정할 수 없어 유연한 사고에 제약이 있을 수 있지만, 셀프 커렉션으로 해결 시도. 🔄
- 53 미니, 제미나이 등은 긴 시간 동안 토큰을 생성하며 문제를 해결하지만, 아직 완벽하진 않음. ⏳
- 딥시크 R1은 5분 정도 걸려 답을 틀렸지만, 재시도 후 정답을 맞춤. 🎯