AWS Summit 후기: 클라우드 스케일링 자동화 전략
by DD
11개월 전
조회수 8
계절성 트래픽 대응을 위해 AWS Auto Scaling을 활용했지만, 급증하는 트래픽에 대한 대응 지연 문제 발생
트래픽 카테고리화, 증설 대상 선정, 자동화 구현 등 4단계 스케일링 전략 제시, 장애 예방 강조
SRE 핵심 원칙 기반, 비즈니스 중심 모니터링(BOM)을 통해 가용성 확보 및 안정적인 시스템 구축 제안
Auto Scaling의 한계와 극복
Auto Scaling은 트래픽 증가 후 반응하여 장애 발생을 완전히 막을 수 없다. 따라서 트래픽 카테고리화를 통해 예측 가능한 트래픽에 대한 선제적 대응이 필요하다. Slack과 Google Calendar를 활용한 자동화는 장애 시간 단축에 기여한다.
효율적인 스케일링 전략: 4단계 접근법
4단계 접근법은 트래픽 카테고리 정의, 증설 대상 선정, 증설 방법 구현, 위험 대응으로 구성된다. 비즈니스 KPI 기반의 모니터링 지표를 정의하고, DB 커넥션 풀과 같은 핵심 지표를 모니터링하여 장애 예방에 집중한다.
SRE와 BOM을 통한 시스템 안정성 확보
SRE의 핵심 원칙인 가용성 확보를 위해 관찰 가능성(Observability)을 높여야 한다. 비즈니스 중심 모니터링(BOM)을 통해 시스템 지표와 비즈니스 지표를 함께 고려하여 안정적인 시스템 구축을 목표로 한다. 자동화는 BOM을 통해 더욱 효과적이다.