올리브영, Datadog으로 결제 시스템 모니터링 구축!
by DD
5개월 전
조회수 42
Datadog을 활용하여 올리브영 주문 결제 시스템의 실시간 모니터링 대시보드를 구축함
로그 분석을 통해 장애 발생 시점 및 원인을 파악하고, 슬랙 알림을 설정함
결제 실패 시 영향 범위를 최소화하고, 고객 불편을 줄이는 것을 목표로 함
Datadog을 활용한 모니터링 아키텍처
올리브영은 Datadog을 사용하여 주문 결제 시스템의 로그 수집, 분석, 시각화를 구현했다. 구체적으로, KEY=VALUE 형태의 로그를 추가하여 Datadog에서 로그 검색을 용이하게 했다. 따라서 Timeseries 및 Query Value 위젯을 활용하여 모니터링 대시보드를 구축했다.
모니터링 시스템 구축의 장단점
Datadog을 통한 모니터링 시스템 구축은 장애 발생 시 빠른 감지 및 대응을 가능하게 한다. 슬랙 알림을 통해 실시간으로 문제 상황을 공유하고, 문제 해결 시간 단축을 기대할 수 있다. 반면, 초기 로그 설계 및 대시보드 구성에 시간과 노력이 필요하며, 알림 폭탄으로 인한 피로도가 발생할 수 있다.
결제 시스템 모니터링 개선 방향
현재는 Grok Parser를 사용하여 로그에서 속성을 추출하는 방식으로 개선 중이다. 결제 수단별, 채널별, 운영체제/브라우저별로 세분화된 모니터링을 통해 문제 발생 원인을 더욱 정확하게 파악할 수 있다. 따라서, 결제 시스템 안정성을 높이고, 고객 만족도를 향상시킬 수 있다.