홈 유튜브 블로그 Top 10

데브허브 안내

소개 업데이트 소식

데브허브 커뮤니티

다른 영상 보기

[DEMO] 초보자가 쿠버네티스에서 돌려본 라마 버전2(llama-2-13b) 13B 모델

조 훈(Hoon Jo)

2023. 7. 20.

0회

#ai

#infra

쿠버네티스에서 라마 버전2(llama-2-13b) 모델을 직접 테스트하고, 결과를 공유하기 위해 13B 모델을 구비로 배포하여 load balancer 로 접근 🧐
변수 처리를 통해 컨텍스트 정보를 관리하고 외부에서 입력받을 수 있도록 수정했음 📝
라마 버전2 모델은 16 vcpu와 10GB pv를 사용하며, 테스트 결과 모델이 16 CPU를 사용하는 것과 같은 차이점을 발견 🤨
개인적인 비교로, alpaca 7b, 13b 모델보다 응답 속도가 느린 경향을 보임 🐢

Recommanded Videos

유니티6.1 최신 API 엑셀 정리자료 공유(한글 설명 포함)

유니티6.1 최신 API 엑셀 정리자료 공유(한글 설명 포함)

2025. 7. 28.

🎂 생일이었는데요 | 자취하는 개발자 일상 브이로그

🎂 생일이었는데요 | 자취하는 개발자 일상 브이로그

2024. 11. 18.

Factory Co-Founder & CTO on Building Reliable AI Agents | LangChain Interrupt

Factory Co-Founder & CTO on Building Reliable AI Agents | LangChain Interrupt

2025. 6. 18.

[파이썬 프로젝트] Ch 09. 주요 경제지표 그래프 | ③주요 경제지표 그래프 그리기

[파이썬 프로젝트] Ch 09. 주요 경제지표 그래프 | ③주요 경제지표 그래프 그리기

2025. 7. 8.

Form Components in Next.js 15 Are About to Get a Whole Lot Better!

Form Components in Next.js 15 Are About to Get a Whole Lot Better!

2024. 10. 30.

Claude Code Can Be Your Second Brain

Claude Code Can Be Your Second Brain

2025. 9. 10.