- NVIDIA는 DeepSeek R1을 사용하여 인간보다 뛰어난 GPU 커널 프로그래밍 AI 시스템을 구축했습니다. 🤖
- 최적화된 어텐션 커널 생성이라는 까다로운 작업에 성공했습니다. 🎯
- DeepSeek R1의 제로샷(zero-shot) 방식이 아닌, 검증 시스템을 통한 반복적 프롬프트 개선 방식을 사용했습니다. 🔄
- KernelBench 기준, 레벨 1 문제는 100%, 레벨 2 문제는 96% 정확도를 달성했습니다. 💯
- 추론 시간(inference time)을 늘릴수록 정확도가 향상되는 것을 확인했습니다. ⏱️