Pinterest, AI로 유해 콘텐츠를 실시간 감지하다!

by DD
5개월 전
조회수 10

PinterestAI 기반 유해 콘텐츠 탐지 시스템인 'Prevalence'를 구축하여 플랫폼 안전성을 강화함

AI 모델을 활용한 샘플링라벨링 과정을 통해 유해 콘텐츠 노출 빈도를 측정하고, 대시보드를 통해 시각화함

유해 콘텐츠 탐지 속도 향상, 데이터 기반 정책 수립, A/B 테스트를 통한 정책 개선 등 다양한 성과를 달성함

AI 기반 유해 콘텐츠 탐지 시스템 아키텍처

Pinterest는 AI 모델을 활용하여 유해 콘텐츠를 탐지하는 'Prevalence' 시스템을 구축했다. 구체적으로, 가중치 기반 샘플링을 통해 이미지 데이터를 수집하고, LLM을 사용하여 대규모 라벨링을 수행한다. 따라서, 유해 콘텐츠 노출 빈도를 실시간으로 측정하고, 데이터 기반 의사 결정을 지원한다.

샘플링 및 라벨링 과정의 기술적 트레이드오프

Prevalence 시스템은 샘플링 효율성라벨링 정확도 사이의 균형을 맞추는 것이 핵심이다. 가중치 기반 샘플링은 고위험 콘텐츠에 집중하여 효율성을 높이는 반면, 샘플링 편향을 방지하기 위해 보정 과정을 거친다. 따라서, AI 모델의 성능데이터 품질 간의 트레이드오프를 고려해야 한다.

실전 적용을 위한 전략적 조언

유사한 시스템 구축 시, 데이터 품질 관리모델 드리프트 방지에 집중해야 한다. 구체적으로, 지속적인 모니터링을 통해 모델의 성능 저하를 감지하고, 정기적인 재학습을 통해 모델을 최신 상태로 유지해야 한다. 따라서, AI 기반 시스템의 지속적인 성능 유지를 위해 노력해야 한다.

How Pinterest Built a Real‑Time Radar for Violative Content using AI