N
Naver d2
December 4, 20252회
LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

간단 소개
Naver가 개발한 LLM 친화적 PDF 파서 PaLADIN은 복잡한 PDF 문서의 표, 차트, 숫자를 LLM이 정확히 이해하도록 돕는다.
AI Summary
PaLADIN 소개 및 필요성
- NAVER ENGINEERING DAY에서 발표된 PaLADIN은 LLM이 복잡한 PDF를 정확히 이해하도록 돕는 파서입니다.
- AI/LLM 활용 및 문서 처리에 관심 있는 개발자를 대상으로 하며, 웹 검색에도 관련됩니다.
- PDF의 중요성을 강조하며, LLM-friendly PDF Parser 기술 탐색 및 PoC 과정을 거쳤습니다. 핵심 기술 및 아키텍처
- nv-ingest 및 PaLADIN 아키텍처를 기반으로 설계되었습니다.
- Element-Detector (Doclayout-Yolo), Table-Extractor (nemoretriever-table-structure-v1), Chart-Extractor (google/gemma3-27b-it), Papago OCR 등 다양한 모델을 활용합니다.
- 표, 차트, 숫자를 정확히 이해하고 표현하는 데 중점을 둡니다. 성능 평가 및 활용
- Parsing 평가셋 구축 및 Parsing 능력, 속도 측정, 성능 비교를 통해 우수성을 입증했습니다.
- AIB 증권사 리포트 서비스에 적용되어 실제 활용 사례를 제시하며, LLM as a judge 모델 선정 방식을 사용했습니다.
- 향후 Table Cell 좌표 오류 및 차트 정확도 개선을 계획하고 있습니다.
Next Feeds

if(kakao)25, 카카오뱅크가 전하는 기술 이야기
카카오뱅크가 if(kakao)25에서 AI 기반 프롬프트 공격 방어, 개발 생산성 도구, 데이터센터 관리 시스템 등 다양한 기술 혁신 사례를 공유하며 금융 기술의 미래를 제시했다.
if(kakao)25카카오뱅크AI기술 컨퍼런스개발 생산성
2025. 12. 4.
카카오뱅크

JSON 데이터베이스로서의 PostgreSQL: 고급 패턴 및 모범 사례
PostgreSQL의 JSONB 데이터 타입과 고급 기능을 활용하여 유연한 데이터 모델링, 효율적인 쿼리 및 검색을 구현하고, AWS 관리형 서비스로 성능을 최적화하는 방법 제시.
PostgreSQLJSONBGIN 인덱스AWS데이터 모델링
2025. 12. 4.
AWS

당근 데이터 지도를 그리다: 컬럼 레벨 리니지 구축기
제공된 콘텐츠는 서버 오류 메시지로, 내용 분석이 불가능합니다.
콘텐츠 오류서버 에러분석 불가빈 내용Medium
2025. 12. 4.
당근

한컴 성장사이 ①: 2025년 한컴 개발문화 회고 – 테크세미나 운영기
한컴은 '성장사이' 개발문화 아래 'AI Agent & 지식그래프' 주제로 전사 테크세미나를 성공적으로 개최하고, 향후 기술 공유 확장을 계획한다.
한컴테크세미나개발문화AI Agent지식그래프
2025. 12. 4.
한글과컴퓨터
AI TOP 100이 우리에게 남긴 것들
카카오는 AI Top 100 경진대회 시스템 개발을 통해 AI 기반의 초고속 PoC 중심 개발과 인간의 판단이 결합된 새로운 개발 표준을 정립하고 개발 문화 혁신을 경험했습니다.
AI개발 표준PoC생산성개발자 역할
2025. 12. 4.
카카오

VLOps:Event-driven MLOps & Omni-Evaluator
NAVER ENGINEERING DAY에서 발표된 VLOps는 Event-driven MLOps와 Omni-Evaluator를 통해 AI 모델 학습, 평가, 배포의 효율성과 유연성을 극대화하는 시스템이다.
VLOpsEvent-driven MLOpsOmni-EvaluatorNAVER ENGINEERING DAYMultimodal LLM
2025. 12. 3.
Naver d2