무신사
우리는 달에 가기로 했습니다. - Hybrid인프라부터 네트워크 최적화까지, 무신사 AI Infra구축기

무신사가 AI 비용 및 성능 문제를 해결하기 위해 온프레미스 GPU와 AWS EKS HybridNode를 결합한 하이브리드 AI 인프라를 구축하고 네트워크를 최적화한 여정.
**AI 인프라 구축 동기 및 도전** * **AI 비용** 폭증과 **GPU 공급난**으로 **지속 가능한 AI**를 위해 **온프레미스 GPU** 운영 필수. * 초기 **관리형 서비스**의 높은 비용 기울기 문제 직면. **하이브리드 인프라 구축 및 난관 극복** * **AWS EKS HybridNode** 도입, **RTX 4090**으로 시작하여 **H100/H200** 확장. * **AWS CNI** 및 **Karpenter** 충돌 등 **레퍼런스 없는** 기술적 난관을 직접 해결, **seamless failover** 구현. * **전력/냉방** 등 물리적 인프라 구축 및 운영 리스크 직접 감당. **네트워크 최적화 및 미래 전략** * **초저지연** 및 **안정성** 확보를 위해 **kube-proxy**를 **eBPF Cilium**으로, **ALB**를 **NLB**로 전환. * **OpenTelemetry** 기반 **플랫폼 중립적 관측성** 구축. * **Gateway API** 활용, **요청 가치**에 따른 **우선순위 라우팅** 실험으로 시스템 안정성 향상.
Next Feeds
Kafka Streams 기반 EDA 구축 사례: 올리브영 품절 시스템 현대화 프로젝트
올리브영이 Kafka Streams 기반 EDA로 품절 시스템을 현대화하여 실시간 재고 처리 및 DB 부하를 86% 감소시킨 사례.

당근 검색 엔진, 쿠버네티스로 쉽게 운영하기 2편 — 데이터 노드 웜업 적용
something wrong

달리는 기차 바퀴 칠하기: 7년만의 컬러 시스템 업데이트
토스 디자인 시스템(TDS)이 7년간 누적된 컬러 시스템 문제를 해결하고 비즈니스 확장을 위해 토큰 시스템을 전면 개편한 과정.
올영세일 선착순 쿠폰, 미발급 0%를 향한 여정
올리브영 선착순 쿠폰 시스템의 비동기 처리 문제로 인한 미발급률을 Redis 이중 카운터 전략으로 0%까지 개선한 과정.

프론트엔드 도구의 전략적 선택: 경량 프레임워크 Vue.js 탐구와 Vue3 적용기
한컴테크가 Vue.js를 경량 프레임워크로 채택한 이유, Vue3 전환 시 Composition API 및 Vite 도입 경험을 공유합니다.

우리가 테스트를 하는 이유. 근데 이제 Golang을 곁들인
Golang 기반의 테스트가 비즈니스 리스크를 줄이고 소프트웨어 품질을 높이는 목적과 'stretchr/testify', 'google/go-cmp' 등 효율적인 테스트 도구 활용법을 설명합니다.