- 강화학습을 통해 슈퍼 마리오를 자동으로 플레이하는 데 성공 🕹️
- Mario는 현재 상태와 가능한 입력만 주어져 학습하며, 이 결과에 따라 보상 획득 🪃
- Super Mario에서 보상은 점수, 목표지점까지의 거리, 게임 시작 시간 경과 등을 종합하여 계산 🥇
- 학습 시간을 단축하기 위해 화면 크기를 줄이고 흑백으로 변환하며 프레임 수를 감소 🚦
- 딥러닝의 CNN 네트워크는 이미지의 특징을 잘 잡고, 이를 기반으로 최적의 입력을 예측하여 학습 🧠
- 슈퍼마리오의 경우 입력 숫자가 적고 화면 해상도가 낮아 개인용 컴퓨터에서도 학습이 가능 📈
- 이 방법은 포켓몬 등 복잡한 규칙을 가진 게임을 플레이하는 인공지능 개발에도 활용 가능 🎮