Grok 4 is NUTS But to be banned?
- Grok 4는 Elon Musk의 xAI가 출시한 매우 인상적인 AI 모델로, Meta AI의 Llama 4를 능가하며 ARC AGI2, GPQA, AM25 등 여러 벤치마크에서 탁월한 성능을 보였습니다. 🚀
- 특히 AM25 수학 테스트에서는 100%를 기록하여 해당 벤치마크를 무용지물로 만들 정도로 뛰어난 능력을 입증했습니다. 💯
- Grok 4를 사용하려면 'Super Gro'라는 새로운 고액 구독 플랜(월 $30 또는 $300)에 가입해야 하며, 이는 AI 모델 접근 비용이 지나치게 높아지는 추세를 보여줍니다. 💸
- 모델의 웹 구현 방식이 논란이 되고 있는데, 특정 민감한 질문에 대해 'Elon의 원칙'에 기반한 편향된 답변을 생성하여 '프롬프트 오염' 또는 모델 조작 의혹을 받고 있습니다. 🗣️
- 이는 모델 자체의 문제가 아닌 웹 구현 과정에서 응답이 조작되었을 가능성이 제기되며, 사용자가 순수한 모델이 아닌 '누군가의 레시피'를 사용하고 있다는 비판이 있습니다. 🧑🍳
- AI 모델 제공 회사들이 사용하는 시스템 프롬프트와 모델 버전에 대한 투명성을 높여 사용자 신뢰를 확보해야 한다는 요구가 있습니다. ⚖️
- 일부에서는 Grok 4를 인공 초지능(ASI)으로 부르기도 하지만, 화자는 이를 중요한 '점진적 개선'으로 보며 아직 ASI 단계는 아니라고 평가합니다. 📈
- 논란이 되는 편향된 답변으로 인해 Grok 4가 미국에서 금지될 가능성도 제기되고 있습니다. 🚫
- 미래 AI 개발자들에게는 대규모 언어 모델(LLM)을 만드는 대신, 모델 성능을 평가할 수 있는 새로운 벤치마크를 개발하는 데 집중할 것을 제안합니다. 🛠️