Netflix, 데이터 분석 시스템 Muse 성능 대폭 개선
by DD
8개월 전
조회수 5
Netflix는 Muse 시스템을 통해 프로모션 미디어의 효과를 분석함
HyperLogLog(HLL) 스케치와 Hollow를 활용하여 쿼리 성능 50% 향상을 달성함
Druid 튜닝을 통해 P99 레이턴시 50% 감소 및 시스템 안정성을 확보함
HLL 스케치와 Hollow를 활용한 데이터 처리 최적화
Netflix는 HLL 스케치를 사용하여 Distinct Count를 효율적으로 계산하고, Hollow를 통해 사전 계산된 Aggregates를 in-memory로 관리한다. 구체적으로 Druid Ingest 과정에서 HLLSketchBuild aggregator를 사용하고, Spark ETL에서 HLL sketch를 병합한다. 따라서 쿼리 성능 향상과 Druid 부하 감소를 동시에 달성했다.
Druid 튜닝을 통한 성능 개선 전략
Netflix는 Druid의 성능을 개선하기 위해 다양한 튜닝 기법을 적용했다. Broker-to-Historical 노드 비율 조정, Segment 크기 최적화, Lookup 활용 등을 통해 P99 레이턴시 50% 감소를 달성했다. 반면, 이러한 튜닝은 Druid 내부 구조에 대한 깊은 이해를 요구하며, 지속적인 모니터링이 필요하다.
안정적인 시스템 운영을 위한 롤아웃 전략
Netflix는 새로운 Muse 시스템의 안정적인 롤아웃을 위해 병렬 스택 배포, 자동화된 오프라인 검증, In-App 데이터 비교 툴링을 활용했다. 따라서 데이터 무결성을 보장하고, 사용자에게 안정적인 서비스를 제공한다. 구체적으로 A/B 테스트와 Feature Flag를 통해 점진적인 배포를 진행했다.
댓글 0
첫 번째 댓글을 남겨보세요!