- 최초의 상용급 확산 기반 거대 언어 모델 등장 ✨
- 기존 자기회귀 모델의 토큰 단위 예측 방식과 달리, 전체 문맥을 한 번에 처리하여 속도 향상 🚀
- Mercury라는 모델은 기존 모델보다 훨씬 빠른 속도(토큰 생성 속도)를 자랑하며, 특히 Mercury Coder Mini는 초당 1100토큰 생성 ⚡
- 성능 면에서도 기존 주요 모델들과 비슷한 수준을 유지하며, 특히 속도에서 압도적인 우위를 보임 🥇
- 중국 연구팀의 오픈소스 80억 파라미터 모델도 존재하며, 확산 과정을 시각적으로 확인 가능 👀
- 새로운 아키텍처의 등장으로 거대 언어 모델의 미래가 밝아짐 🌅