How to Create a Self Healing Code Agent
- 코드 에이전트의 정확도와 성능을 향상시키는 방법은 정적 분석을 통해 코드 오류 및 불일치를 검사하는 것이다. 🔎
- Reflection 단계를 통해 에이전트가 생성된 코드를 검증하고 개선할 수 있다. 🔄
- OpenEvals는 타입 검사 및 샌드박스 평가와 같은 도구를 제공하는 오픈 소스 패키지이다. 📦
- Pytype 및 MyPy를 사용하여 생성된 코드의 타입 검사를 수행할 수 있다. ⌨️
- LLM을 심판으로 활용하여 코드에 대한 피드백을 받을 수 있다. 👩⚖️
- E2B와 통합하여 격리된 샌드박스에서 코드 평가를 실행할 수 있다. 🧪
- 샌드박스 환경은 임의의 종속성을 설치하거나 실행하지 않고 타입 검사를 수행하는 데 유용하다. 🛡️
- 샌드박스 실행 평가기는 종속성을 설치하고 런타임 오류를 검사한다. ⚙️
- Reflection 노드는 샌드박스 Pytype 코-평가기를 생성하여 에이전트의 출력을 검사한다. 🤖
- 에이전트 응답에 코드가 포함되어 있고 평가 결과가 False인 경우, 오류 메시지를 에이전트에 다시 전달하여 코드를 재생성하도록 한다. 📢