Gemini 3.0 (Riftrunner Fully Tested): The WORST Gemini 3 Checkpoint YET.
- 새로운 Gemini 3 체크포인트 'RiftRunner'가 출시되었으나, 이전 버전들에 비해 성능이 저하되었습니다. 📉
- 전반적으로 테스트된 Gemini 3 체크포인트 중 최하위(5위)를 기록하며, 특히 X58 체크포인트보다 약 14% 낮은 점수를 보였습니다. 📊
- 일부 작업(예: 3JS 포켓볼, 나비 애니메이션)에서는 좋은 성능을 보였지만, 체스보드 자동 플레이와 같은 중요한 질문에서는 처음으로 실패했습니다. ❌
- 성능 저하의 원인으로 보안 필터 추가, 채팅 사용 사례에 대한 튜닝, 양자화 또는 플래시 기반 모델 가능성이 제기되었습니다. ⚙️
- 현재 Sonnet보다 약 15% 높은 점수를 기록했지만, 이전의 '세대적 도약' 수준에는 미치지 못한다는 평가입니다. 🐢
- 리뷰어는 X58과 같은 우수한 이전 체크포인트를 다시 사용할 수 있기를 바라며, Google이 모델을 공식 출시하기를 촉구했습니다. 🙏
- Apple과 Google의 협력으로 1.2조 파라미터 모델(Gemini 3)이 논의 중이며, 빠른 추론을 위해 플래시 모델이 사용될 가능성이 언급되었습니다. 🚀
데브허브 | DEVHUB | Gemini 3.0 (Riftrunner Fully Tested): The WORST Gemini 3 Checkpoint YET.