넷플릭스(Netflix), 로컬라이제이션(Localization) 분석 시스템 현대화로 글로벌 시청 경험 개선

by DD
3개월 전
조회수 22

넷플릭스(Netflix)는 3억 명 이상의 회원을 위해 50개 이상의 언어로 더빙 및 자막을 제작하며 로컬라이제이션(Localization) 시스템 확장의 필요성을 느낌

기존의 파편화된 분석 워크플로우(Workflow), 중복된 파이프라인(Pipeline), 분리된 대시보드(Dashboard)를 통합하여 데이터 일관성(Data Consistency) 확보를 목표로 함

"Language Asset Producer" 테이블과 같은 중앙 집중형 데이터 모델(Centralized Data Model)을 구축하여 데이터 중복을 제거하고 유지보수성을 향상시킴

향후 자막의 읽기 속도와 같은 이벤트 레벨(Event-Level) 분석을 통해 회원 참여도(Member Engagement)를 높일 계획

분석 시스템 현대화의 배경: 기술 부채(Technical Debt) 해결

본문에 따르면 넷플릭스(Netflix)는 로컬라이제이션(Localization) 관련 지표를 여러 도메인에 복제하여 보고의 일관성(Consistency in Reporting) 문제유지보수 부담(Maintenance Burden)을 겪었다.

분산된 로직(Distributed Logic): "누가 이 더빙을 만들었는가?"와 같은 간단한 질문에도 복잡한 로직이 필요

중복된 파이프라인(Duplicated Pipelines): 각 사용 사례별로 로직을 복사하여 업스트림 로직 변경(Upstream Logic Changes) 시 유지보수 어려움 발생

해결책: 데이터 통합(Data Consolidation), 표준화(Standardization), 신뢰성(Trust)을 기반으로 하는 현대화 전략 채택

데이터 통합을 위한 3가지 핵심 전략

넷플릭스(Netflix)는 분석 시스템 현대화를 위해 3가지 전략을 추진했다.

감사 및 통합(Audit and Consolidation): 40개 이상의 대시보드(Dashboard) 및 도구에 대한 감사 진행, 프론트엔드 시각화(Frontend Visualizations) 개선 대신 백엔드 파이프라인(Backend Pipelines) 통합에 집중

Not-So-Tech Debt 감소: 사용자 경험(User Experience) 개선을 위해 Language Asset Consumption 도구 개선, 오디오 및 텍스트 언어를 통합하여 원어(Original Language)와 현지화된 콘텐츠(Localized Content) 소비 패턴 분석

핵심 빌딩 블록(Core Building Blocks) 투자: "Write Once, Read Many" 아키텍처(Architecture) 도입, "Language Asset Producer" 테이블과 같은 중앙 집중형 테이블을 구축하여 데이터 중복 제거 및 로직 업데이트(Logic Updates)의 즉각적인 전파(Propagation) 보장

중앙 집중형 데이터 모델(Centralized Data Model)의 장점

넷플릭스(Netflix)는 중앙 집중형 데이터 모델을 통해 데이터 일관성(Data Consistency)을 확보하고 유지보수성을 향상시켰다.

"Who made this dub?" 문제 해결: "Language Asset Producer" 테이블을 통해 더빙 제작자 정보에 대한 단일 진실 공급원(Single Source of Truth) 제공

다운스트림 도메인(Downstream Domains) 영향: Dub Quality 및 Translation Quality 지표에 즉각적인 로직 업데이트(Instant Logic Updates) 전파

데이터 중복 제거: 여러 파이프라인에 걸쳐 중복되던 로직을 통합하여 유지보수 비용(Maintenance Cost) 절감 및 데이터 품질(Data Quality) 향상

향후 이벤트 레벨(Event-Level) 분석 도입 계획

넷플릭스(Netflix)는 자산 수준(Asset-Level) 지표를 넘어 이벤트 레벨(Event-Level) 분석으로 확장할 계획이다.

세분화된 데이터 모델(Granular Data Model): 개별 자막 라인과 같은 세분화된 시간-텍스트 이벤트(Timed-Text Events) 캡처를 위한 일반 데이터 모델 구축

회원 참여도(Member Engagement) 향상: 자막 특성(읽기 속도 등)이 회원 참여에 미치는 영향 분석, 자막 제작 가이드라인(Style Guidelines) 개선

궁극적인 목표: 다양한 글로벌 시청자에게 최고의 넷플릭스 경험 제공, 로컬라이제이션(Localization) 품질 향상

Scaling Global Storytelling: Modernizing Localization Analytics at Netflix