개발자를 위한 인프라 메트릭 완벽 가이드: CPU, 메모리, 네트워크, 디스크 사용량 분석!

by DD
5개월 전
조회수 31

DevOps 엔지니어 경험을 바탕으로 인프라 메트릭 중요성을 강조함

CPU, Memory, Network, Disk 등 4가지 핵심 인프라 메트릭 설명

OOM, 타임아웃 등 문제 발생 시, 메트릭 분석을 통한 문제 해결 능력 강조

CPU 사용량: 트랜지스터 스위칭과 성능 저하

CPU 사용량은 CPU 내 수십억 개 트랜지스터의 스위칭 빈도를 백분율로 나타낸다. 구체적으로 HTTP 요청 처리는 수많은 이진 연산의 집합으로, 트랜지스터 스위칭을 통해 이루어진다. 따라서 CPU 사용률 100%는 타임아웃 발생의 직접적인 원인이 되며, 성능 병목을 유발한다.

메모리 사용량: 커패시터와 OOM 킬러

메모리는 데이터를 커패시터에 저장하며, OOM 발생 시 커널은 프로세스를 종료한다. 따라서 Out Of Memory(OOM)는 시스템 전체의 셧다운으로 이어질 수 있다. 반면 메모리 누수는 시스템 안정성을 저해하는 주요 원인이며, OOM 킬러는 이를 방지하기 위한 커널의 핵심 기능이다.

네트워크, 디스크 I/O: 병목 현상과 성능 저하

네트워크 대역폭은 NIC를 통해 초당 전송되는 비트 수를 의미하며, 부족 시 패킷 손실 및 지연 시간을 증가시킨다. 구체적으로 디스크 I/O는 데이터 읽기/쓰기 속도를 나타내며, 디스크 사용량 100%는 쓰기 실패를 유발한다. 따라서 병목 현상을 파악하고, 적절한 자원 할당이 필요하다.

Software 개발에서 꼭 알아야하는 인프라 메트릭