데브시스터즈, Datadog 활용 노하우 공개!

by DD
1년 전
조회수 10

Datadog Live with Devsisters 행사에서 데브시스터즈의 Datadog 활용 사례 공유

게임 개발팀, 플랫폼 팀, 데브옵스 팀Datadog 활용 사례 소개 및 질의응답 진행

쿠버네티스 환경 모니터링, 부하 테스트, 장애 알람 설정 노하우 공유

Datadog 도입 배경과 효과

데브시스터즈는 AWS 클라우드 환경에서 서비스 안정성을 위해 Datadog을 도입했다. 구체적으로, 기존 모니터링 도구의 한계를 극복하고 Anomaly 등의 기능을 활용하여 장애 감지 및 대응 능력을 향상시켰다. 따라서, 쿠키런: 오븐브레이크 출시 당시 병목 현상을 빠르게 해결하는 데 기여했다.

팀별 Datadog 활용 사례 분석

게임 개발팀은 RPS 모니터링을 통해 서버 부하를 실시간으로 확인하고, APM을 활용하여 성능 개선을 시도한다. 플랫폼 팀은 서비스 맵을 통해 MSA 환경의 서비스 간 의존성을 파악하고, 서드파티 API의 문제 발생 여부를 감지한다. 따라서, 장애 상황에 대한 빠른 대응이 가능해졌다.

효율적인 인프라 관리 및 알람 설정

데브시스터즈는 쿠버네티스 클러스터를 각 게임별로 분리하여 관리하고, EKS 테라폼 모듈을 통해 인프라 관리 효율성을 높였다. 데이터독슬랙 연동을 통해 알람 가이드라인을 구축하고, 대응 시간에 따라 알람 기준을 세분화했다. 결과적으로, 장애 대응 시간 단축커뮤니케이션 효율성을 확보했다.

Datadog Live with Devsisters 돌아보기