Langchain의 모델 호출 제한 미들웨어는 자율 에이전트가 과도한 API 호출로 인해 예산을 소진하거나 통제 불능 상태가 되는 것을 방지하는 가드레일 역할을 합니다. 🛡️
이 미들웨어는 단일 호출(run limit) 또는 전체 대화(thread limit)에 걸쳐 모델 호출 횟수를 제한할 수 있습니다. 🔢
제한 초과 시 에이전트의 동작을 '정상 종료(end)' 또는 '오류 발생(error)'으로 설정하여 유연하게 대응할 수 있습니다. 🛑
데모에서는 고객 서비스 에이전트가 청구 서브 에이전트에 작업을 위임하고, 서브 에이전트의 모델 호출이 제한을 초과하면 ModelCallLimitExceededError를 발생시켜 메인 에이전트가 이를 감지하고 인간 상담원에게 에스컬레이션하는 시나리오를 보여줍니다. 🧑💻
이를 통해 복잡하거나 해결하기 어려운 요청에 대해 에이전트가 무한 루프에 빠지거나 불필요한 비용을 발생시키는 것을 방지하고, 예측 가능한 오류 처리 및 사용자 경험을 제공합니다. 💰