이 영상은 Llama 3.2 시각적 모델을 활용하는 OCR 도구인 LlamaOCR을 보여줍니다. 이미지와 스캔한 문서를 표, 목록, 스프레드시트와 같은 요소의 원래 서식을 유지하면서 구조화된 마크다운으로 변환하는 이 도구의 기능에 중점을 둡니다. Colab 환경에서 JavaScript와 Python으로 작성된 튜토리얼과 코드 스니펫을 제공하는 실제 사용 사례를 다룹니다.
LLM 사용 및 에이전트 구축에 대한 더 많은 튜토리얼은 Patreon에서 확인하세요.
Patreon: / samwitteveen
Twitter: / sam_witteveen
Colab: https://drp.li/WpdNm
🕵️ LLM 에이전트 구축에 관심이 있으신가요? 아래 양식을 작성하세요.
LLM 에이전트 구축 양식: https://drp.li/dIMes
⏱️타임스탬프:
00:00 LlamaOCR 프로젝트
00:56 사이트 사용 데모
02:43 Colab 데모
04:40 Together.AI 문서
06:06 가격
09:16 Python OCR 버전
11:20 태국어 OCR 프로젝트
16:30 Patreon