[KO] 에이전트를 학습시킬 수 있는 리얼한 환경? | 꼬리의 꼬리를 무는 페이퍼
- 현재 대형 언어 모델(LLM)은 다음 토큰 예측에 강하지만, 장기적인 계획 및 행동이 필요한 실제 자율 에이전트 태스크 수행에는 한계가 있습니다. 🤖
- 이러한 격차의 핵심 원인은 에이전트가 행동을 학습하는 데 필요한 풍부하고 인터랙티브하며 현실적인 환경 데이터의 부족입니다. 📉
- 이 문제를 해결하기 위해 '넥스(Nex) 생태계'라는 에이전트 스케일링을 위한 종합 인프라가 제안되었습니다. 🌐
- 넥스 생태계는 세 가지 주요 구성 요소로 이루어집니다: 넥스 AU는 복잡한 에이전트 계층 구조를 유연하게 구성할 수 있는 모듈식 프레임워크를 제공합니다. 🏗️
- 넥스 A4A는 자연어 설명을 통해 다양한 에이전트 계층 구조와 워크플로를 자동으로 생성하여 도메인과 태스크의 다양성을 확장합니다. 🧠
- 넥스 GAD는 코드 실행 환경, 웹 브라우저 등 실제 툴 및 외부 시스템과 에이전트를 연결하여 시뮬레이션-현실 격차를 줄이고 현실 기반의 인터랙션 트레젝터리를 생성합니다. 🛠️
- 넥스 생태계에서 생성된 다양하고 복잡한 인터랙션 데이터(다단계 플래닝, 툴 사용, 피드백 기반 적응 포함)를 사용하여 오픈소스 대형 언어 모델인 '넥스 N1'을 학습시켰습니다. 🚀
- 넥스 N1은 다양한 에이전트형 및 코딩 벤치마크에서 강력한 오픈소스 모델들을 꾸준히 능가하며, 복잡한 태스크에서 상위급 상용 모델에 근접하는 성능을 보여주어 인터랙티브 환경의 중요성을 입증했습니다. 🏆
- 이 연구는 단순히 모델 크기를 키우는 것보다 인터랙티브 환경과 트레젝터리를 스케일업하는 것이 에이전트 성능을 크게 향상시킬 수 있음을 시사합니다. 📈
- 궁극적으로 넥스 생태계는 환경이 자동으로 생성되고 점점 더 어려워지며 객관적으로 검증 가능한 대규모 강화 학습 플랫폼으로 발전하여 에이전트의 지속적인 자기 개선을 지원하는 것을 목표로 합니다. 🌱
데브허브 | DEVHUB | [KO] 에이전트를 학습시킬 수 있는 리얼한 환경? | 꼬리의 꼬리를 무는 페이퍼