Gemini 2.5 Computer Use: BEATS Claude SONNET 4.5 & OpenAI!
- Google Gemini 2.5 컴퓨터 사용 모델이 출시되어 브라우저 제어 및 반복 작업 자동화 능력을 제공합니다. 🚀
- 양식 작성, 인터넷 검색, 대화형 요소 조작, 로그인 후 작업 등 광범위한 자동화 기능을 기본적으로 수행합니다. 🤖
- 작업 지시, 모델 응답, 환경 실행, 새 상태 캡처의 반복 루프를 통해 작업을 완료하는 방식으로 작동합니다. 🔄
- Claude Sonnet 4.5 및 OpenAI 컴퓨터 사용 에이전트 모델을 능가하며, 공식 리더보드에서 69%로 OpenAI의 61%보다 높은 점수를 기록했습니다. 🏆
- 다른 모델 대비 낮은 지연 시간과 높은 정확도를 제공하여 전반적인 효율성이 크게 향상되었습니다. ⚡
- 현재 API를 통해 미리보기 버전으로 제공되어 개발자들이 쉽게 접근하고 활용할 수 있습니다. 💻
Google Genai, Playright 패키지 및 Chromium을 사용하여 간단하게 구현 가능하며, 제공된 코드로 웹 자동화 작업을 수행할 수 있습니다. 🛠️
- URL에서 정보 추출 및 웹사이트 내 스티커 메모 드래그 앤 드롭 시연을 통해 실제 작동 능력과 향상된 속도를 입증했습니다. 🎯
- 이전 모델보다 훨씬 빠른 속도로 작업을 처리하며, 특히 스티커 메모 이동 시 약 5초 만에 항목을 처리하는 등 효율성이 크게 개선되었습니다. 💨