하
하이퍼커넥트
March 28, 20251회
Apache Flink 어플리케이션의 End-to-End Latency 병목 찾아내기

간단 소개
Flink 어플리케이션의 end-to-end latency 병목을 진단하고 개선하는 과정을 소개하며, Application 및 Operator 레벨 분석 방법을 제시합니다.
AI Summary
- Flink 어플리케이션 End-to-End Latency 개선
- Flink 어플리케이션의 성능 튜닝은 지속적으로 필요하며, 특히 Azar 서비스는 end-to-end latency가 중요합니다.
- 개선 과정은 Application level과 Operator level 두 단계로 나뉩니다.
- Application Level: Operator 단위 지표 수집 및 관찰
- 각 operator별 처리 시간과 처리 외 시간을 측정하여 병목 구간을 파악합니다.
- 처리 시간은 어플리케이션 코드 실행 시간, 처리 외 시간은 데이터 de/serialize, 네트워크 I/O 시간 등을 포함합니다.
- Flink 자체 LatencyMarker 기능은 성능 저하가 크고 정확도가 떨어지는 한계가 있습니다.
- Operator Level: Flame Graph를 통한 프로파일링
- Flame graph를 활용하여 operator 내부의 병목 지점을 분석합니다.
- 처리 시간이 병목인 경우 어플리케이션 로직을 점검하고, 처리 외 시간이 병목인 경우 네트워크 I/O 또는 Flink 내부 코드를 확인합니다.
- 네트워크 I/O 병목 시 TaskManager 네트워크 설정 튜닝, 네트워크 인프라 점검 등을 시도할 수 있습니다.
- Flink 내부 코드 병목 시 Kryo serializer 대신 POJO serializer를 사용하는 것을 고려할 수 있습니다.
Next Feeds
애니메이션에서 찾아보는 디지털 트윈 기술 - 뼈대구성에서 모방학습까지
애니메이션 리깅 기술을 활용한 디지털 트윈의 제조 산업 적용 사례와 미래 전망을 제시합니다.
디지털 트윈리깅IK 솔버리타게팅모방 학습
2025. 3. 27.
현대자동차
토스 피플: 이것도 ‘나니까’ 할 수 있다고 생각하기
토스 Product Designer 이지윤님의 인터뷰. 토스 합류 전후 경험, 성장 과정, 그리고 현재의 자세에 대한 이야기.
토스Product Designer이지윤성장경험
2025. 3. 27.
토스

Karpenter 트러블슈팅 — 비용과 안정성 두 마리 토끼 잡기
Karpenter 도입 과정에서 겪은 트러블슈팅 경험과 해결 방안, 그리고 도입 효과 및 향후 개선 과제를 다룬 글입니다.
Karpenter쿠버네티스오토스케일링트러블슈팅인프라
2025. 3. 27.
당근

AI로 생성한 이미지는 어떻게 평가할까요? (기본편)
AI 이미지 생성 모델 평가 방법(시각적 품질, 프롬프트 일치율)과 다양한 평가 지표를 소개합니다.
AI 이미지 생성평가 방법FIDCLIP Score프롬프트 일치율
2025. 3. 27.
LY Corp
React Native에서 타입 안전한 파일 기반 라우팅 구현하기
토스 Bedrock 프레임워크의 타입 안전 파일 기반 라우팅 구현 방식과 개선된 useNavigation 훅을 통한 개발 효율성 향상 방안을 제시합니다.
React NativeBedrock타입 안전파일 기반 라우팅useNavigation
2025. 3. 26.
토스

이번 주에 낚시대는 얼마일까?
SSG.COM은 MAB를 활용하여 가격 최적화를 진행하고, Thompson Sampling과 Sliding window를 통해 모델 성능을 개선한다.
MABThompson Sampling가격 최적화머신러닝KPI
2025. 3. 26.
SSG