openAI 의 새모델 O1 이 보여주는 성능이 인상적입니다.
O1 이 GPT-4.5 라는 이름을 쓰지 않은 이유는 이 모델이 매우 중간재적인 성격을 가지고 있기 때문이지 않을까라고 생각합니다. 그 자체로도 엄청난 성능을 보이는 것에는 의심의 여지가 없고 앞으로도 많은 활용예제들이 나올 것임에는 분명하긴 합니다만, 결국 O1 이 만들어내는 수많은 데이터셋을 근간으로 차세대 일반모델 (GPT-5)가 학습되고 있을 것이고, 이 모델은 O1 이 test-time compute(즉 인퍼런스 과정)을 통해서 만들어내는 엄청난 reasoning 성능들을 내부의 parameter 에 그대로 담고 있을 테니까요. 뭔가 독립변수처럼 여겨졌던 Data 와 Algorithm 역시 Compute 에 종속변수가 되어가고 있는 요즘입니다.
승준님과 함께 O1 이 AGI 로 나아가는 단계에서 어떠한 역할을 하고 있는지, 그리고 O1 을 만든 팀원들의 주변강연들을 통해서 조금은 철학적일수도 있는 배경에 대해서 한번 살펴보았습니다.
이번 내용에 쓰인 자료는 아래 링크를 참고해주세요.
https://erucipe.notion.site/o1-108d5c...