크
크리에이트립
October 10, 20241회
unified + rehype 를 사용하여 경제적인 LLM번역 프로세스 구축하기

간단 소개
unified와 rehype를 사용하여 LLM 번역 프로세스에서 HTML 전처리를 통해 토큰 사용량을 줄이고 번역 품질을 향상시킨 사례를 소개합니다.
AI Summary
- AI 번역 프로세스 효율화 배경
- 크리에이트립은 14개 언어로 블로그 콘텐츠를 제공하며, LLM을 활용한 AI 번역 프로세스를 도입하여 콘텐츠 담당자의 리소스를 절감하고자 함.
- 기존 방식의 문제점은 HTML 형식 번역 시 LLM 환각 현상으로 인한 태그 누락, 속성 손실, 과도한 토큰 사용으로 인한 비용 증가였음.
- unified와 rehype를 활용한 전처리
- unified는 다양한 형식 파싱 및 변환을 지원하는 생태계이며, rehype는 HTML 파싱 및 조작을 위한 플러그인 집합임.
- HTML 간소화를 위해 unified와 rehype를 선택, HTML을 AST로 변환하여 불필요한 속성 제거 후 번역, 이후 속성 복원하는 방식 적용.
- PoC 결과, 약 40%의 토큰 절감 효과를 확인하고 비용 절감 및 LLM 환각 문제 감소 효과를 얻음.
- 결론 및 활용
- unified 생태계를 통해 HTML 뿐 아니라 다양한 형식의 콘텐츠를 효율적으로 처리하고 최적화할 수 있음.
- 크리에이트립 내부에서 rehype를 활용한 플러그인을 통해 HTML 콘텐츠 속성 수정 요구사항에 대응하고 있음.
Next Feeds
Typescript의 데코레이터, FrontEnd에도 적용해볼까?
Typescript 데코레이터의 개념과 활용법, FrontEnd 개발 적용 가능성을 분석하고, 실무 적용을 위한 준비의 중요성을 강조합니다.
Typescript데코레이터FrontEndReact클래스
2024. 10. 10.
현대자동차

Locust를 활용한 부하 테스트 작성
Locust를 활용한 부하 테스트 작성 방법과 예시를 소개합니다. Python 기반의 Locust는 유연하고 확장성이 뛰어나며, 다양한 테스트 시나리오를 지원합니다.
Locust부하 테스트PythonRate Limiting마스터-워커
2024. 10. 10.
skplanet

Behind the Paper: 하이퍼커넥트 AI 조직이 제품에 기여하면서 연구하는 법
하이퍼커넥트 AI 조직의 제품 기여 연구 사례 및 노이즈 러닝을 통한 문제 해결 과정을 소개합니다.
AI머신러닝노이즈 러닝전이 행렬테크 스펙
2024. 10. 9.
하이퍼커넥트
모듈화를 통한 SwiftUI Preview 효율화
타다 iOS 팀은 모듈화를 통해 SwiftUI Preview 성능을 극대화하고 UI 개발 효율성을 향상시켰습니다. Mock 데이터와 Hot Reload, 세분화된 UI 컴포넌트 관리가 핵심입니다.
모듈화SwiftUI PreviewUI 개발디버깅Mock 데이터
2024. 10. 8.
VCNC
UX Writing 관점에서 일상 속 앱(App) 바라보기
UX Writing의 중요성과 핵심 포인트를 분석하고, 다양한 앱 서비스 사례를 통해 UX Writing의 효과를 설명합니다.
UX Writing사용성브랜드 이미지앱 서비스배달의 민족
2024. 10. 7.
현대자동차
NHN Cloud Plugin 개발기 | Cloudforet 오픈소스 프로젝트 후기
Cloudforet NHN Cloud Plugin 개발 후기: Linux Foundation 멘토십 프로그램을 통해 NHN Cloud 자원 관리 플러그인을 개발하고 오픈소스에 기여한 경험.
CloudforetNHN Cloud오픈소스플러그인클라우드 자원
2024. 10. 7.
NHN