TARS Agent: Powerful AI Operating System Can Automate ALL Computer Tasks! (Opensource)
- TARS Agent는 GUI 에이전트와 비전을 터미널, 컴퓨터, 브라우저에 통합하는 강력한 오픈 소스 멀티모달 AI 에이전트 스택임. 💻
- CLI 및 웹 UI를 통해 인간과 유사한 작업 완료 방식으로 멀티모달 LLM과 상호 작용 가능. 🌐
- Price Line을 사용하여 항공편 예약과 같은 실제 워크플로우에서 자율적으로 작업을 수행할 수 있음. ✈️
- UI TARS 데스크톱 앱은 로컬 및 원격 컴퓨터, 브라우저를 제어하는 AIOS(AI 운영체제) 역할을 함. 🖥️
- 브라우저 및 시스템 운영자를 통해 엔드 투 엔드 작업 수행 가능. ⚙️
- Agent TARS는 CLI 및 웹 UI에서 작동하는 멀티모달 AI 에이전트 스택이며, UI TARS는 TARS 스택 기반 데스크톱 앱임. 💡
- 노드(Node)가 설치되어 있어야 하며, OpenAI 또는 Bulk Engine과 같은 모델 제공자를 통해 실행 가능. 🔑
- 웹 UI를 통해 다양한 작업을 수행하고, 터미널 기반 명령을 실행하며, MCP(Multi-modal Compositional Perception)를 활용하여 데이터 시각화 가능. 📊
- Apache 2.0 라이선스 하에 제공됨. 🛡️
- UI TARS는 로컬 앱, 원격 시스템, 브라우저를 제어하며, Seed 1.5 및 1.6 멀티모달 모델로 구동됨. 🤖
- UI TARS를 통해 Nvidia 주가 검색, Python 스크립트 생성, 리서치 보고서 작성 등의 작업 자동화 가능. 📈
- 다양한 액세스 방법(애플리케이션, 터미널, 웹 UI)을 제공하며, 지속적으로 업데이트됨. 🔄