[Unite Seoul 2025] Unity ML-Agents를 이용한 컨테이너 적재 최적화, Deep Dive ver.
- 유니티 ML-Agents는 강화 학습 환경 구축 및 학습 설정을 유니티 에디터 내에서 가능하게 하는 오픈 소스 패키지입니다. 📦
- 컨테이너 적재 문제는 컨테이너를 쌓는 행위와 재취급 횟수를 최소화하는 것을 목표로 정의됩니다. 🎯
- 강화 학습 환경 구축 시 에이전트의 행동은 가능한 작은 단위로 설계해야 하며, 컨테이너를 내리거나 올리는 두 가지 행동으로 분리됩니다. 🧱
- 보상은 컨테이너를 잘 쌓을 때마다 주어지며, 실수 시에는 몰수됩니다. 💰
- 5층 이상 컨테이너를 쌓지 못하도록 마스킹 처리를 통해 에이전트의 행동을 제어할 수 있습니다. 🚫
- 컨테이너 적재 환경은 각 위치마다 제일 위에 쌓여 있는 컨테이너의 적재 정보만 가져와 효율성을 높입니다. ⚙️
- 파이토치를 사용하여 ML-Agents 환경을 학습시키고, 야멜 파일을 통해 학습 환경 및 하이퍼파라미터를 설정합니다. ⚙️