시스템 장애, 이제 막아보자! Cascading Failure 방지 전략

Cascading Failure의 정의와 긍정적 피드백 루프(Positive Feedback Loop)를 통해 장애가 확산되는 원리를 설명함.

Google Maps와 AWS US East-1의 실제 사례를 통해 Cascading Failure가 글로벌 서비스에 미치는 영향을 강조함.

동기식 호출(Synchronous Calls)을 피하고, Orchestrator 대신 Choreography Pattern을 사용하는 방법 제시함.

Retries, Capacity Planning, Circuit Breaker, Load Shedding 등 Cascading Failure를 방지하기 위한 다양한 전략을 소개함.

Cascading Failure의 이해

발표자는 Cascading Failure가 긍정적 피드백 루프(Positive Feedback Loop)에 의해 발생하는 연쇄적인 장애라고 설명한다. 시스템 내 작은 장애가 다른 서비스에 과부하를 유발하고, 이로 인해 추가 장애가 발생하며, 이러한 과정이 반복되어 Dominio Effect를 초래한다고 강조한다. 발표자는 Google Maps와 AWS US East-1의 사례를 통해 Cascading Failure가 글로벌 서비스에 미치는 심각한 영향을 보여준다.

Cascading Failure 방지 전략: 비동기 통신

Cascading Failure의 정의와 긍정적 피드백 루프(Positive Feedback Loop)를 통해 장애가 확산되는 원리를 설명함.

Google Maps와 AWS US East-1의 실제 사례를 통해 Cascading Failure가 글로벌 서비스에 미치는 영향을 강조함.

동기식 호출(Synchronous Calls)을 피하고, Orchestrator 대신 Choreography Pattern을 사용하는 방법 제시함.

Retries, Capacity Planning, Circuit Breaker, Load Shedding 등 Cascading Failure를 방지하기 위한 다양한 전략을 소개함.

시스템 장애, 이제 막아보자! Cascading Failure 방지 전략

Cascading Failure의 이해

Cascading Failure 방지 전략: 비동기 통신

시스템 장애, 이제 막아보자! Cascading Failure 방지 전략

Cascading Failure의 이해

Cascading Failure 방지 전략: 비동기 통신

Cascading Failure 방지 전략: Retries, Capacity Planning

Cascading Failure 방지 전략: Circuit Breaker, Load Shedding

댓글 0

댓글 0