컬리 데이터 분석가의 맛있는 데이터, 어떻게 만들까?
by DD
4년 전
조회수 10
데이터 분석가의 주요 업무인 요구사항 정의, 데이터 탐색, 데이터 QA 과정을 소개
운영 데이터와 분석 데이터를 분리하여 데이터 사용성과 품질을 확보
데이터 QA를 통해 데이터 품질을 높이고, 적절한 시점에 데이터를 활용하는 방법 제시
데이터 분석 프로세스: 요구사항 정의부터 QA까지
데이터 분석은 요구사항 정의에서 시작하여, 데이터 탐색, 데이터 QA를 거쳐 완성된다. 구체적으로, 사내 고객과의 소통을 통해 분석 목적을 파악하고, 데이터 소스를 결정한다. 따라서, 데이터 품질 관리를 위한 QA 과정은 필수적이며, 데이터 정확성을 확보한다.
운영 데이터 vs 분석 데이터: 분리의 중요성
운영 데이터는 시스템 운영을 위해, 분석 데이터는 분석을 위해 사용된다. 운영 데이터와 분석 데이터를 분리함으로써, 시스템 변경에 대한 데이터 사용성을 유지한다. 반면, 분석 데이터는 데이터 품질을 확보하기 위해, 별도의 QA 과정을 거쳐야 하며, 데이터 구조를 체계적으로 관리한다.
데이터 QA: 품질 확보를 위한 핵심 단계
데이터 QA는 데이터 품질을 확보하기 위한 핵심 단계이다. 구체적으로, 데이터 전처리 과정을 통해 이상 데이터를 제거하고, 데이터 검증을 수행한다. 따라서, 데이터 QA를 통해 데이터 정확성을 높이고, 분석 결과의 신뢰도를 향상시킨다. 결과적으로, 데이터 기반 의사결정을 지원한다.