- 트랜스포머 인코더는 RNN 대신 자기 주의를 기반으로 텍스트를 처리하며, 텍스트의 순서를 인식하여 더 효과적인 파라미터 학습을 가능하게 합니다 🧐.
- 에러 역전파를 통해 텍스트 분류와 같은 다양한 작업에 활용할 수 있습니다 📚.
- 입력 토큰은 임베딩과 포지션 인코딩을 통해 벡터 형태로 변환되고, 자기 주의, Feed-forward 네트워크를 반복적으로 적용하여 텍스트 정보를 추출합니다 🧠.
- 최종 출력은 평균을 계산하는 풀링 레이어를 통과하여 2차원 벡터로 축소되며, 이 벡터는 분류로 사용됩니다 🎯.