- 이번 비디오에서는 vLLM 프레임워크를 활용하여 FastAPI와 연동하는 방법을 배우고, 이를 통해 웹 API를 구축하여 외부에서 vLM을 사용할 수 있게 합니다. 🌠
- vLLM 프레임워크는 기본적으로 FastAPI를 포함하고 있으며, EngineX, Docker 등의 도구를 통해 분산 배포가 가능합니다. 🚢
- FastAPI 서버 스크립트를 작성하여 vLM 모델 정보 및 요청을 처리하는 로직을 구현합니다. 💻
- Postman을 사용하여 생성된 FastAPI 서버에 요청을 보내 vLM 모델에서 응답을 받아 확인할 수 있습니다. 📩
- 이를 통해 vLLM을 웹 API로 접근하고 사용할 수 있는 환경을 구축할 수 있습니다. 👍