Kiro CLI로 RDS/Aurora 장애 분석을 자동화하세요!

by DD
1주 전
조회수 20

Kiro CLI를 사용하여 EC2, Bastion, CI/CD 환경 등 IDE 접근이 어려운 환경에서 RDS/Aurora 장애 분석 자동화를 구현

Custom Agent(kida-daily, kida-issue)를 정의하여 일일 점검 및 이슈 원인 분석을 터미널 환경에서 수행

Steering 파일MCP 서버를 재사용하여 IDE와 동일한 분석 품질을 유지하며, 분석 결과 HTML 보고서 생성

Aurora MySQL 환경에서 Replication Lag 시나리오를 재현하여 InnoDB Index RW Lock 경합을 근본 원인으로 식별

Kiro CLI 설치 및 설정

본문에서는 Kiro CLI 설치를 위해 `curl` 명령어를 사용하며, MCP 서버 및 Steering 파일 설정을 통해 분석 환경을 구성한다.

`curl` 기반 설치: Kiro CLI 설치는 단일 명령어로 간편하게 수행되며, `uvx` 설치를 통해 MCP 서버 실행 준비

브라우저 인증: EC2와 같은 헤드리스 환경에서 최초 실행 시 브라우저 인증(Browser Authentication)을 거쳐야 하며, 이후 자동 로그인

MCP 서버 설정: `mcp.json` 파일을 통해 CloudWatch MCP, AWS MCP, AWS Knowledge MCP 서버를 설정하여 다양한 분석 도구 활용

Custom Agent를 활용한 분석 자동화

Kiro CLI는 Custom Agent를 통해 일일 점검 및 이슈 분석을 자동화하며, 대화형 모드와 스크립트 실행을 지원한다.

kida-daily Agent: RDS/Aurora 일일 점검 보고서를 자동 생성하며, `--no-interactive` 옵션을 통해 스크립트 자동 실행 지원

kida-issue Agent: 특정 시간대의 장애/성능 이슈를 심층 분석하며, CloudWatch 메트릭, 로그, RDS 이벤트 등을 수집

모델 선택: `model` 필드를 통해 Claude-Sonnet, Claude-Opus 등 다양한 LLM 모델 선택 가능

Steering 파일의 역할과 활용

Steering 파일은 분석 가이드를 제공하며, MCP 도구 사용 구분 및 메트릭 구분을 통해 분석 품질을 향상시킨다.

글로벌 Steering: `~/.kiro/steering/`에 저장된 Steering 파일은 모든 프로젝트에 자동 적용되어 일관성 유지

MCP 도구 사용 구분: CloudWatch MCP 우선 사용 및 AWS MCP 보조 사용으로 분석 범위 확장

메트릭 구분: 인스턴스/클러스터 레벨 메트릭 구분을 통해 분석 정확도 향상 (CPU, Memory, Connections, VolumeBytesUsed 등)

Aurora MySQL Replication Lag 분석

실제 Replication Lag 시나리오를 통해 Kiro CLI의 이슈 분석 능력을 검증하며, 근본 원인을 파악한다.

테스트 환경: Aurora MySQL 클러스터에서 Writer 부하 발생을 통해 Reader의 Replication Lag 유발

kida-issue Agent 실행: CloudWatch 메트릭, Database Insights, RDS Events, CloudTrail 등을 수집하여 분석

근본 원인 분석: InnoDB Index RW Lock 경합을 주요 원인으로 식별하고, DB Load 132.8, WriteIOPS 234배 급증 확인

Kiro CLI의 장점 및 활용 방안

Kiro CLI는 터미널 환경에서 RDS/Aurora 장애 분석을 자동화하여 개발 생산성을 향상시키고, 다양한 활용 방안을 제시한다.

EC2/SSH 환경 지원: IDE 없이도 EC2, Bastion, CI/CD 환경에서 RDS/Aurora 분석 가능

분석 품질 유지: IDE와 동일한 MCP 서버 및 Steering 파일 사용으로 분석 품질 보장

자동 보고서 생성: `--no-interactive` 모드를 통해 스크립트, cron 연동으로 자동 보고서 생성 가능

향후 계획: 다음 글에서 EC2 + cron + SES/Slack을 활용한 자동 보고서 수신 방법 소개

Part 2: Kiro로 RDS/Aurora 장애 분석 자동화하기 — 터미널에서 분석하기