EP 51. AI Agent 개발의 어려운 점, Browser Use 를 중심으로
- 에이전트 시장이 급속도로 뜨거워지고 있으며, 사업화 쪽으로 태세 전환이 이루어지는 분위기다. 🔥
- 브라우저를 활용한 에이전트 개발이 중요하며, OpenAI의 Deep Research와 유사한 방식으로 작동한다. 🌐
- 충분한 지능을 갖춘 모델과 적절한 프롬프트, 웹 검색 도구 활용이 문제 해결의 핵심이다. 🔑
- 모델의 능력이 idiot savant 같지만, 이미지 인식 능력 등 특정 분야에서 매우 뛰어나다. 🖼️
- Codex CLI를 활용하여 브라우저를 제어하는 실험을 진행하고 있으며, 비용 절감이 중요하다. 💰
- 크롬 개발자 도구를 활용하여 브라우저와 Codex CLI를 연결하는 브리지를 만들었다. 🌉
- 에이전트 개발은 쉽지 않으며, 비결정적인 문제와 시행착오가 많다. 🐛
- 피드백을 통해 방향을 조정하는 것이 중요하며, 환경 변화를 관리해야 한다. 🔄
- Gemini가 Pokémon Blue를 클리어한 것은 에이전트 기술의 발전을 보여주는 사례다. 🎮
- Operator와 Fellou 같은 도구들이 등장하며, 에이전트 활용이 더욱 쉬워지고 있다. 🛠️