이 영상에서는 Google의 새로운 Gemini 3 Flash를 실제 환경에서 에이전트 벤치마크 테스트를 통해 검증합니다. Gemini CLI와 무료 Antigravity 래퍼를 사용하여 앱을 빌드하고, 어떤 설정이 완벽하고 현대적인 UI를 제공하는지, 어떤 설정이 2000년대 스타일의 조잡한 UI를 제공하는지 살펴봅니다.
-- 주요 내용:
🚀 Gemini 3 Flash는 Antigravity로 래핑했을 때 7%의 점수 향상과 함께 20위로 도약했습니다.
💸 Antigravity는 즉시 사용 가능하고 무료인 반면, Gemini CLI는 여전히 대기자 명단에 올라 있으며 완성도가 떨어지는 코드를 생성합니다.
🔗 Antigravity에서 Flash는 Go TUI와 Svelte Kanban을 Opus보다 더 잘 구현하지만, Tauri와 Nuxt는 두 설정 모두에서 제대로 구현하지 못합니다.
🛠️ Antigravity는 컨텍스트 유지, 도구 호출 및 LSP 지원에서 뛰어난 성능을 보여주며, 한 시간 동안 실행해도 깔끔한 UI를 유지합니다.
📊 같은 모델, 같은 프롬프트: Antigravity는 9위, Gemini CLI는 21위로 추락 - 구글 내부 영역 다툼은 실제로 존재한다.
🎨 UI/UX의 마법은 Antigravity 내부의 ShadCN 시스템 프롬프트 강제 표시와 더 긴 에이전트 체인에서 비롯된 것으로 보인다.
👍 Flash는 비용 효율적인 프런트엔드 플랫폼이지만, 기본 스택에서 벗어나면 오류의 악순환에 빠르게 빠질 수 있다.