Meta's Latest Model Is...Weird.
- Meta의 Llama 4 모델 출시, 1000만 토큰 컨텍스트 창 등 흥미로운 특징 존재 🦙
- 오픈 소스 AI 도구 발전 기여에도 불구하고, Meta는 Quen, Deepseek 등 경쟁 모델에 비해 뒤쳐지는 듯한 인상 🐌
- 코드 리뷰의 어려움을 해결하기 위한 Graphite의 AI 코드 리뷰어 Diamond 소개, 무료 플랜 제공 💎
- Llama 4는 Behemoth, Maverick, Scout 세 가지 모델로 구성, 예상보다 빠른 출시 🚀
- Meta는 익명의 모델에 대한 두려움 또는 경쟁 가속화로 인해 Llama 4를 서둘러 출시했을 가능성 😨
- 다양한 종류의 데이터를 처리할 수 있는 멀티모달 모델에 대한 설명, Mixture of Experts 개념 소개 🧠
- Scout 모델은 동급 최고의 멀티모달 모델이라고 주장하지만, 일부 벤치마크에서 기대 이하의 성능을 보임 📉
- Meta의 벤치마크 조작 의혹 제기, 일부 직원은 이에 항의하여 사직했다는 주장도 있음 🤫
- Gemini 2.0 Flash가 대용량 컨텍스트 검색에서 뛰어난 성능을 보인다는 분석 🔦
- Meta가 LM Marina 벤치마크에서 특정 모델 버전을 사용하여 점수를 조작했다는 의혹 🎭