데브허브 | DEVHUB | 구글 TPU와 또 다르다… AWS, 자체칩 서비스 시작 | NVIDIA 독자규격 흡수 | NVLink Fusion + MGX 기반 의미구글 TPU와 또 다르다… AWS, 자체칩 서비스 시작 | NVIDIA 독자규격 흡수 | NVLink Fusion + MGX 기반 의미
- AWS는 자체 개발 AI 칩인 트레이니움 3와 4를 발표하며 구글 TPU 및 엔비디아 GPU 시장에 도전장을 내밀었습니다. 🚀
- 트레이니움 3 울트라 서버는 EC2 인스턴스로 상업적 제공을 시작하여, 연구용이 아닌 실제 클라우드 서비스 상품으로 자리매김했습니다. 💰
- 트레이니움 3는 이전 버전 대비 전력당 토큰 비율이 5배 향상되었으며, 최대 144개의 칩을 연결하여 대규모 스케일업이 가능합니다. ✨
- 트레이니움 4는 엔비디아와 협력하여 NVLink Fusion 및 MGX 랙 아키텍처를 통합하도록 설계 중이며, 엔비디아의 독점 기술을 AWS 칩에 적용합니다. 🤝
- 엔비디아는 NVLink Fusion을 개방하여 자체 표준의 지배력을 확장하고, AWS는 이를 통해 자체 칩 개발 속도를 높이는 상호 이익적 전략을 취하고 있습니다. 🌐
- AWS의 궁극적인 목표는 AI 워크로드의 총 소유 비용(TCO)을 절감하고, 클라우드 서비스 경쟁력을 강화하는 것입니다. 📉
- 프로젝트 레이니어는 2025년 말까지 100만 개 이상의 트레이니움 2 칩을 30개 데이터 센터에 배포하여 엔트로픽 클로드와 같은 대규모 AI 워크로드를 지원할 계획입니다. 🏗️
- 이러한 자체 칩 개발 경쟁은 TSMC의 CoWoS 패키징 기술 케파에 크게 의존하며, 이는 시장의 병목 현상으로 작용할 수 있습니다. 🏭
- AWS는 구글 TPU의 3D 토러스 구조와 달리 엔비디아의 시스템 플랫폼을 활용하여 랙 스케일 확장을 추진하며, 자체 고성능 네트워킹(EFA)도 활용합니다. 📡
- 전반적으로 빅테크 기업들은 GPU를 완전히 대체하기보다는, 랙 스케일 표준을 재정의하고 TCO를 줄이기 위한 다양한 접근 방식을 시도하고 있습니다. 🔄