[OneLineAI 손규진 X 테디노트] 비전공자에서 AI 연구원이 되기까지, Reasoning Model 이 열어줄 새로운 가능성 🔥
- 비전공자(경제학 전공)에서 AI 연구원이 된 손규진 연사가 추론 모델(Reasoning Model)의 현재와 미래, 그리고 비전공자의 AI 연구원 진입 경로에 대해 논의합니다. 🧑🎓
- 추론 모델은 DeepSeek-Math 이후 주목받았으나, 현재는 벤치마크 점수 고착화 단계로, 높은 컴퓨팅 비용 대비 '언제, 어디에 사용할 것인가'에 대한 실증적 고민이 중요해지고 있습니다. 🤔
- 추론 모델의 핵심 가치는 장시간(예: 48시간, 심지어 한 달) 사고를 통해 복잡한 문제를 해결하는 능력에 있으며, 이는 일반적인 비추론 모델의 체인 오브 쏘트(Chain-of-Thought) 모방과는 근본적인 차이가 있습니다. ⏳
- 최근 연구는 추론이 새로운 능력을 '잠금 해제'하는 것이 아니라, 모델 내에 숨겨진 '잠재 능력'을 '끌어내는' 것에 가깝다는 시각을 제시합니다. 💡
- 오픈AI는 과학자 대체 AI 개발에 집중하며 STEM 분야(수학, 코딩, 과학) 벤치마크를 주로 사용하고, 특히 논문 구현 능력(PaperBench)을 평가합니다. 🔬
- 구글은 검색 엔진 대체 방어를 위해 사실성(Factuality), 긴 컨텍스트 처리, 인간 정렬(Human Alignment)에 중점을 둡니다. 🔍
- 메타는 일반 사용자 대상 서비스에 초점을 맞춰 비교적 쉬운 벤치마크와 인간 정렬 평가를 중요시합니다. 👥
- 오픈AI의 PaperBench 연구에 따르면, 인간은 사고 시간이 늘어날수록 성능이 선형적으로 향상되지만, AI 모델(O1)은 특정 시간(약 3시간) 이후 성능 향상이 정체되는 한계를 보입니다. 📈
- 딥마인드는 과학적 발견 자체에 초점을 맞춘 독특한 연구를 진행하며, AI가 단순히 문제를 푸는 것을 넘어 새로운 지식을 창출하는 방향을 모색합니다. 🧪
데브허브 | DEVHUB | [OneLineAI 손규진 X 테디노트] 비전공자에서 AI 연구원이 되기까지, Reasoning Model 이 열어줄 새로운 가능성 🔥