유튜브블로그Top 10
내 프로필

데브허브 안내
소개업데이트 소식

데브허브 커뮤니티

Holy smokes! China destroys top models with this release!

1littlecoder

2025. 9. 24.

0

#ai
  • 중국의 Quen 3VL 모델 중 가장 큰 버전(총 2350억, 활성 220억 매개변수)이 Apache 2.0 라이선스로 오픈 소스화되었습니다.🚀
  • Gemini 2.5 Pro를 포함한 주요 독점 모델들을 시각 인지 벤치마크에서 능가하며, 광범위하고 투명한 비교 벤치마크를 제공했습니다.🏆
  • 텍스트, 시각적 맥락, 추론, 긴 컨텍스트, 공간 관계 등 다양한 차원에서 모델의 이해도를 개선하는 데 중점을 두었습니다.🧠
  • 모바일 또는 노트북 인터페이스에서 특정 버튼을 클릭하는 등 GUI를 위한 시각 에이전트 역할을 수행할 수 있습니다.🖱️
  • 손으로 그린 스케치(냅킨 드로잉)를 HTML, CSS, JavaScript 코드로 변환하거나 draw.io 디자인 목업으로 전환하는 등 복잡한 시각 코딩 작업을 처리합니다.🎨
  • 이미지 내 두 지점 간의 상대적 거리 등 공간적 관계를 더 잘 이해하고 2D 접지 능력이 뛰어납니다.📐
  • 최대 256,000 토큰의 긴 컨텍스트 길이를 지원하며, 힌디어, 아랍어 등 비로마자 스크립트를 포함한 39개 언어에 대한 다국어 OCR 기능을 제공합니다.🌍
  • 복잡한 테이블 이미지를 완벽하게 마크다운으로 변환하고, 메뉴판에서 특정 항목의 가격을 정확히 찾아내는 등 정밀한 정보 추출 및 변환 능력을 시연했습니다.✅
  • 모델 공개뿐만 아니라 상세한 벤치마크 보고서 제공을 통해 오픈 소스 커뮤니티에 크게 기여하고 있습니다.✨

Recommanded Videos