LG유플러스, Bedrock AgentCore로 클라우드 관리 AI Agent 구축
LG유플러스는 멀티 클라우드 환경 통합 관리를 위해 자체 플랫폼 UCMP(Uplus Cloud Management Platform)를 구축하고, AI Agent를 도입하여 사용자 경험 개선(User Experience Improvement)을 목표로 함
AWS Bedrock AgentCore Runtime을 선택하여 대규모 동시 세션 처리 및 세션 격리(Session Isolation)를 위한 안정적인 인프라를 구축하고, 서버리스(Serverless) 환경의 장점을 활용함
MCP(Model Context Protocol) Server를 활용하여 다양한 AWS 서비스와 연동하고, CloudWatch Generative AI Observability를 통해 Agent의 동작을 모니터링함
Strands-Agents SDK를 사용하여 ReAct 패턴 기반의 Agent를 개발하고, Bedrock Guardrail을 통해 안전한 응답(Safe Response)을 보장함
Bedrock AgentCore Runtime의 핵심 아키텍처
LG유플러스는 AI Agent 배포를 위해 AWS Bedrock AgentCore Runtime을 선택하여 서버리스(Serverless) 환경의 이점을 활용했다. 특히, AgentCore Runtime은 세션별 격리된 microVM 환경을 제공하여 대규모 동시 세션(Large-scale Concurrent Sessions)을 안정적으로 처리한다.
MicroVM 격리: 각 세션은 독립된 CPU, 메모리, 파일 시스템을 할당받아 세션 간 데이터 오염(Data Contamination)을 방지
자동 스케일링: 수백만 세션까지 자동 확장 가능하며, 트래픽 변화에 유연하게 대응
소비 기반 과금: 실제 CPU 사용 시간만 과금하여 비용 효율성(Cost Efficiency)을 극대화
이러한 아키텍처는 Agent 개발자가 인프라 관리 부담 없이 Agent 로직에 집중할 수 있도록 지원한다.
Strands-Agents SDK를 활용한 Agent 개발
LG유플러스는 AWS가 제공하는 Strands-Agents SDK를 사용하여 Agent를 개발했다. Strands-Agents SDK는 Bedrock 및 다른 AWS 서비스와 네이티브하게 통합되어 안정적인 운영(Stable Operation)을 보장한다.
ReAct 패턴: LLM이 상황을 판단하고 도구를 선택, 실행, 관찰하는 ReAct(Reason-Act-Observe-Next) 패턴을 따르며, 개발자는 각 단계를 명시적으로 구현할 필요 없음
Bedrock Guardrail: 부적절한 응답이나 민감 정보 노출을 방지하기 위해 콘텐츠 필터링(Content Filtering), PII 마스킹(PII Masking), 주제 제한 기능 제공
MCP Tool 통합: Strands SDK의 AgentTool 인터페이스를 구현하여 MCP Server를 Agent의 도구로 등록, 확장성(Extensibility) 확보
Strands-Agents SDK는 AWS 서비스와의 통합을 통해 Agent 개발 및 운영의 효율성을 높인다.
MCP(Model Context Protocol) Server 통합
LG유플러스는 UCMP Agent에 다양한 기능을 추가하기 위해 AWS가 제공하는 MCP Server를 활용했다. MCP는 Agent가 외부 도구와 통신하는 방식을 표준화하여 확장성(Extensibility)을 높인다.
동적 도구 발견: Agent가 시작될 때 설정된 MCP Server를 순회하며 각 Server가 제공하는 도구를 자동으로 발견
MCP Server 추가: 새로운 MCP Server를 추가할 때 Agent 코드 수정 없이 설정만 추가하여 개발 속도(Development Speed) 향상
AWS 서비스 연동: Cost Explorer, CloudTrail, Security Hub 등 주요 서비스 MCP Server를 활용하여 다양한 기능 구현(Various Feature Implementation)
MCP Server 통합은 Agent의 기능 확장과 유지보수를 용이하게 한다.
CloudWatch Generative AI Observability를 활용한 모니터링
LG유플러스는 Agent의 안정적인 운영을 위해 CloudWatch와 통합된 Generative AI Observability를 활용한다. 이를 통해 Agent의 동작을 상세하게 추적하고, 문제 발생 시 빠른 디버깅(Fast Debugging)을 지원한다.
기본 메트릭: 세션 수, 레이턴시, 에러율, 토큰 사용량, 리소스 사용량 등 핵심 메트릭 자동 수집
Generative AI Observability: Agent의 추론 과정, 도구 호출, 실행 경로를 시각화하여 문제 해결 시간 단축(Reduced Troubleshooting Time)
세션 추적: 특정 사용자 세션의 전체 대화 흐름을 추적하여 사용자 경험(User Experience) 개선
CloudWatch Generative AI Observability는 Agent의 운영 효율성을 높이고, 문제 발생 시 신속하게 대응할 수 있도록 지원한다.
UCMP Agent의 실제 활용 사례
LG유플러스는 UCMP Agent를 활용하여 클라우드 관리 업무를 자동화하고 있다. 이를 통해 운영 효율성(Operational Efficiency)을 높이고, 사용자에게 향상된 경험(Enhanced Experience)을 제공한다.
계정별 주요 변경 이력 추적: CloudTrail MCP Server를 활용하여 EC2 인스턴스 생성/삭제, IAM 정책 변경 등 주요 이벤트 추적
계정별 FinOps 리포트 자동화: Cost Explorer MCP Server를 기반으로 비용 데이터를 분석하고, 계정별 맞춤 리포트 자동 생성
자연어 기반 트러블슈팅: 자연어 질문을 통해 문제 해결 방안 제시, 클라우드 경험이 적은 개발자도 쉽게 문제 해결
UCMP Agent는 클라우드 관리 업무 자동화를 통해 개발자 및 운영자의 생산성을 향상시킨다.