다
다나와
May 16, 20231회
Elasticsearch 3TB의 인덱스를 reindex 하는 방법

간단 소개
Elasticsearch 대용량 인덱스 reindex 시 속도 향상 및 안정성 확보를 위한 설정 팁과 트러블슈팅 경험 공유.
AI Summary
- 대용량 인덱스 Reindex 최적화
- 다나와는 10억 건 이상의 상품 데이터를 Elasticsearch로 관리하며, 검색 품질 향상을 위해 매주 reindex를 수행한다.
- 3TB 규모의 데이터를 18개 노드(마스터 2개, 데이터 16개)로 구성된 환경에서 약 10~11시간에 걸쳐 색인한다.
- Reindex 속도 향상 및 문제 해결
- Replica 생성은 reindex 완료 후에 진행하여 초기 IO 부담을 줄인다.
- refresh_interval을 -1로 설정하여 불필요한 새로 고침 프로세스를 중단한다.
- 배치 사이즈를 조정하여 최적의 색인 효율을 찾고, 프라이머리 샤드 수를 조절하여 작업 속도를 관리한다.
es_rejected_excutution_exception발생 시 쓰로틀링을 통해 큐 자원 부족 문제를 해결하고,circuit_breaker_exception발생 시 작업 시간대 변경 또는 옵션 조정을 통해 부하를 낮춘다.
Next Feeds

Luft 성능 리포트 2023.1
Luft 성능 개선 필요성과 도전, 향후 로드맵을 제시하고, 데이터 분산, 스토리지 개선, 파이프라인 최적화 등을 통해 성능을 향상시키고 있습니다.
LuftOLAP성능 개선데이터 분산EBS
2023. 5. 5.
AB180

요새 Github 릴리스 노트를 누가 수동으로 만드나요!?
GitHub 워크플로우를 활용하여 iOS 앱 릴리스 노트 생성 과정을 자동화하고 개발 효율성을 향상시키는 방법을 소개합니다.
GitHub릴리스 노트자동화워크플로우iOS
2023. 5. 3.
뤼이드

I am sick of making Github release notes!
Github Workflows를 사용하여 Github release notes 생성 과정을 자동화하고 개발 효율성을 향상시키는 방법에 대한 설명.
Githubrelease notes자동화Github Workflowsdevops
2023. 5. 3.
뤼이드

뷰티컬리에서 <나의 컬리 스타일>이 갖는 의미
뷰티컬리의 '나의 컬리 스타일'은 개인 맞춤형 상품 추천을 위한 초석이며, 사용자 경험 개선과 카테고리 확장을 통해 발전할 것이다.
뷰티컬리나의 컬리 스타일개인화사용자 경험프로필
2023. 5. 1.
컬리

이벤트 로그 체계 구축 여정
기존 이벤트 로그 체계의 문제점을 개선하고, 데이터 분석 효율성, 문서 접근성, 디버깅 효율성을 향상시킨 이벤트 로그 체계 구축 여정을 공유합니다.
이벤트 로그데이터 분석로그 설계FirebaseBigQuery
2023. 4. 28.
스포카
[장애회고] ORM(JPA) 사용 시 예상치 못한 쿼리로 인한 HikariCP 이슈
ORM 사용 중 예상치 못한 쿼리로 인한 HikariCP 이슈 분석 및 해결 과정, 관련 에러 재현 및 HikariCP 로깅 설정에 대한 상세 분석.
HikariCPJPAORMOutOfMemoryErrorConnection Leak
2023. 4. 27.
사람인