데브허브 | DEVHUB | OpenAI o3 vs Gemini 2.5 Pro in GeoGuessr AI Duel: This Is Just INSANE!OpenAI o3 vs Gemini 2.5 Pro in GeoGuessr AI Duel: This Is Just INSANE!
- AI 지오게서 대결은 '움직임, 패닝, 줌 불가'의 가장 어려운 맵 설정으로 시작되어 AI의 한계를 시험했습니다. 🗺️
- 두 AI 모델 모두 식생, 지형, 기후, 지질학적 특징, 심지어 특정 동물 종(새, 조개껍데기)과 같은 시각적 단서를 분석하여 위치를 추론하는 인상적인 능력을 보여주었습니다. 🧠
- GPT-3(03)는 몬테인 대나무, 아프리카 몬테인 대나무, 석회암 유형 등 매우 구체적인 식물학적 및 지질학적 세부 정보를 제공하여 추론을 뒷받침했습니다. 🌿
- Gemini 2.5 Pro는 일관되게 더 빨랐으며, 종종 조개껍데기에서 '해안 사막'과 같은 광범위한 추론을 먼저 한 후 세부적으로 좁혀나갔습니다. ⚡
- '움직임 불가' 설정은 매우 어려웠으며, 초기 라운드에서 두 AI 모두 상당한 지리적 오차를 보였습니다. 🚫
- 두 장의 이미지(반대 방향)를 제공하고 '움직임'을 허용하자 AI의 추론 정확도와 구체성이 크게 향상되어 경쟁이 더욱 흥미로워졌습니다. 📸
- Gemini 2.5 Pro는 전반적으로 더 나은 성능을 보였으며, 더 많은 라운드에서 승리하고 실제 위치에 지리적으로 더 가까운 경우가 많았습니다. 🏆
- 두 AI 모두 태양의 위치(남반구), 도로 유형(완벽하게 직선인 남북 아스팔트), 심지어 특정 조류 군집과 같은 미묘한 단서를 성공적으로 활용하여 위치를 좁혔습니다. 🔍
- 인상적인 분석에도 불구하고, 두 모델 모두 여전히 상당한 오류를 범했으며, 때로는 다른 대륙을 추측하거나 수백/수천 킬로미터 벗어나는 등 지오게서의 복잡성을 보여주었습니다. 🚧
- 마지막 터널 라운드는 GPT-3의 답변이 완전히 공개되지 않아 최종 승패를 알 수 없었습니다. ⏳