GitHub Actions 장애, Azure 문제로 인한 서비스 중단

by DD
4개월 전
조회수 14

GitHub Actions의 성능 저하 및 부분적 장애 발생, Azure 문제로 인한 영향

Azure의 VM 스케일링 문제로 인해 GitHub Actions, Copilot, Dependabot 등 기능에 영향

커뮤니티에서는 Azure로의 이관에 대한 불만과 서비스 안정성에 대한 우려 제기

장애 발생 원인은 Microsoft 관리 스토리지 계정의 접근 권한 설정 변경으로 확인

Azure 문제로 인한 GitHub Actions 장애

GitHub Actions의 장애는 Azure의 VM 스케일링 문제와 밀접하게 연관되어 발생했다. 특히, Microsoft가 관리하는 스토리지 계정의 접근 권한 설정 변경이 주요 원인으로 지목되었다. 호스팅된 러너(Hosted Runner)에서 작업이 대기하거나 실패하는 현상이 발생했으며, 이는 Copilot 및 Dependabot과 같은 GitHub의 다른 기능에도 영향을 미쳤다. Azure의 문제로 인해 GitHub 서비스 전반에 걸쳐 가용성(Availability) 문제가 발생했다.

커뮤니티의 Azure 이관에 대한 비판

커뮤니티에서는 GitHub가 Azure로 이관되는 과정에서 발생한 문제에 대해 비판적인 시각을 보였다. 특히, 'upstream provider'라는 표현으로 Azure를 언급하는 것에 대해, 같은 회사임에도 책임을 회피하려는 태도로 해석했다. 이러한 상황은 GitHub 엔지니어들의 불만을 야기할 수 있으며, 서비스 안정성에 대한 신뢰도(Reliability)를 저하시키는 요인으로 작용할 수 있다.

GitHub 서비스 중단에 대한 다양한 의견

GitHub 서비스 중단에 대한 다양한 의견이 제시되었다. 일부 사용자는 GitHub Actions의 장애로 인해 작업이 지연되고, 사용 시간이 낭비되는 문제에 대해 불만을 표출했다. 또한, GitHub의 전반적인 성장 둔화(Stagnation)에 대한 우려와 함께, 서비스 안정성에 대한 의문을 제기하는 의견도 있었다. 데이터 미저장 정책(Zero-Retention Policy)을 통해 서비스 안정성을 확보해야 한다는 주장도 제기되었다.

장애 발생에 따른 기술적 영향

GitHub Actions의 장애는 개발자들의 CI/CD 파이프라인(CI/CD Pipeline)에 직접적인 영향을 미쳤다. 작업이 큐에 대기하거나 실패하면서, 개발 생산성이 저하되고, 배포 지연이 발생했다. 특히, 셀프 호스팅 러너(Self-hosted Runner)를 사용하지 않는 개발자들은 장애의 영향을 더 크게 받았다. 이러한 상황은 개발자들이 데이터 격리 아키텍처(Data Isolation Architecture)를 고려하도록 만들 수 있다.

GitHub experience various partial-outages/degradations