Hacker News 다운, 무슨 일이?
by DD
5개월 전
조회수 2
Hacker News가 일시적으로 다운되어, 인증된 요청에 502 에러가 발생하고 캐시된 페이지가 노출됨
과도한 크롤링 방지를 완화한 것이 원인으로 추정되며, PagerDuty 알림 시스템의 문제도 겹침
사용자들은 Hacker News 접속 불가에 대한 불편함을 토로하며, 공식 상태 페이지의 정확성에 대한 의문을 제기함
장애 발생 원인 분석
Hacker News 장애는 과도한 크롤링을 막기 위한 보호 조치 완화로 인해 발생했을 가능성이 높다. 구체적으로, SBCL 프로세스를 종료하는 스크립트가 작동하지 않아 장애가 장시간 지속되었다. 따라서, 서버 과부하를 막기 위한 추가적인 조치가 필요하며, 모니터링 시스템의 개선도 요구된다.
PagerDuty 알림 시스템 문제점
장애 발생 시 PagerDuty 알림 시스템이 제대로 작동하지 않아, 담당자가 문제를 인지하지 못하고 잠들었던 점이 문제로 지적된다. 반면, 알림 설정을 개선하여 장애 발생 시 즉각적인 대응이 가능하도록 해야 한다. 결과적으로, 장애 대응 프로세스의 재검토가 필요하다.
커뮤니티 반응 및 상태 페이지 신뢰도
사용자들은 Hacker News 접속 불가에 대한 불편함을 표출하며, 공식 상태 페이지의 정확성에 대한 의문을 제기했다. 구체적으로, Twitter의 변경으로 인해 상태 페이지의 정보가 최신 정보를 반영하지 못하는 문제가 발생했다. 따라서, 상태 정보를 정확하고 신속하게 제공할 수 있는 다른 채널을 확보해야 한다.