카
카카오페이
December 19, 20241회
Document AI로 문서 검토 한방에 끝내기
간단 소개
카카오페이손해보험에서 Document AI를 활용하여 문서 검토를 자동화하고, 구현 과정과 고려 사항을 소개합니다.
AI Summary
- Document AI 개요
- Document AI는 기계 학습, 자연어 처리 기술을 활용해 문서 내용을 자동 인식 및 처리하는 기술이다.
- 문서 이미지 입력 -> Key-Value 형태 데이터 출력 과정을 거친다.
- 주요 Task에는 OCR, Layout Analysis, Classification, Parsing 등이 있다.
- 카카오페이손해보험의 Document AI 활용
- 휴대폰 보험 서비스에서 수리비 영수증의 수리처, 발행일, 결제금액 정보를 인식하는 데 사용된다.
- Edge Detection -> Layout Analysis -> OCR -> Parsing 순서로 처리한다.
- YOLO 모델은 Edge Detection과 Layout Analysis에 활용, TrOCR 모델은 OCR에 활용된다.
- 구현 시 고려 사항
- 회전된 이미지 보정, 수리비 영수증 필터링, OCR 오인식 문자 보정 등의 예외 처리가 필요하다.
- 레빈슈타인 디스턴스 알고리즘을 활용하여 OCR 오인식 문자를 보정한다.
- 시간당 800원 수준의 서버 비용으로 AI 기반 문서 인식 기술 개발이 가능하다.
Next Feeds

Java 가상 스레드, 깊이 있는 소스 코드 분석과 작동 원리 2편 - 컨텍스트 스위칭
Java 가상 스레드의 컨텍스트 스위칭 작동 방식과 NioSocketImpl 예시를 통해 park, unpark 메서드의 역할 및 스택 프레임 관리를 설명한다.
가상 스레드컨텍스트 스위칭parkunparkNioSocketImpl
2024. 12. 19.
LY Corp

CloudFront의 숨은 힘: 캐싱 없이도 극대화 되는 성능과 비용 효율성
CloudFront는 캐싱 없이도 PoP 활용, 네트워크 최적화, HTTP/3 프로토콜 등을 통해 동적 콘텐츠의 성능과 비용 효율성을 극대화할 수 있다.
CloudFrontCDNHTTP/3AWS네트워크 최적화
2024. 12. 19.
원티드

이번 주에 낚싯대는 몇 개가 팔릴까?
SSG.COM의 수요예측팀은 롱테일 상품의 간헐적 수요 예측 문제 해결을 위해 다양한 통계적, 머신러닝 기법을 전략적으로 활용하고 있다.
수요예측롱테일 상품간헐적 수요Croston method데이터 부족
2024. 12. 19.
SSG

Airflow로 펀드 배치 시스템 완벽 구축하기
카카오뱅크가 Airflow를 활용하여 금융 규제를 준수하면서 효율적인 펀드 배치 시스템을 구축한 과정과 핵심 기술을 소개합니다.
Airflow클라우드 네이티브배치 시스템금융 규제KubernetesPodOperator
2024. 12. 19.
카카오뱅크
[디지털 트윈 기술 #4] 디지털 트윈 블랙박스(리플레이) 기술
디지털 트윈 기술 기반 3D 리플레이 시스템 개발 및 활용 방안, 언리얼 엔진 기반 구현과 향후 개선 방향 제시
디지털 트윈리플레이 시스템언리얼 엔진3D 시각화제조 공정
2024. 12. 18.
현대자동차
외부 서비스 장애와 멀어지기
카카오모빌리티는 외부 서비스 장애를 줄이기 위해 이벤트 기반 데이터 관리, 비동기 처리, API 요청 관리 등의 전략을 사용하고 있습니다.
CQRS이벤트 기반비동기 처리서킷 브레이커트래픽 관리
2024. 12. 18.
카카오모빌리티