Pinterest, AI로 Observability 혁신
by DD
6개월 전
조회수 6
Pinterest는 OpenTelemetry(OTel) 도입 이전의 레거시 Observability 시스템의 한계를 인식함
Model Context Protocol(MCP) 서버와 AI 에이전트를 활용하여 로그, 메트릭, 트레이스를 통합
Tricorder Agent를 통해 문제 분석 시간 단축 및 엔지니어의 문제 해결 지원
MCP 서버 아키텍처 심층 분석
MCP 서버는 AI 에이전트에게 로그, 메트릭, 트레이스 등 다양한 Observability 데이터를 통합적으로 제공한다. 구체적으로, Anthropic에서 제안한 Model Context Protocol을 기반으로 구축되어, 에이전트가 필요한 도구를 선택하여 사용할 수 있도록 설계되었다. 따라서 데이터 통합과 유연한 확장성을 동시에 확보한다.
AI 에이전트의 한계와 극복 전략
AI 에이전트는 모델 컨텍스트 크기의 제약으로 인해 모든 데이터를 한 번에 처리하기 어렵다. Pinterest는 링크 생성 및 도구 문서화를 통해 이 문제를 해결한다. 링크 생성을 통해 관련 대시보드로 직접 연결하고, 특정 도구의 사용법을 명시하여 에이전트가 효율적으로 데이터를 처리하도록 돕는다.
Tricorder Agent: 실전 적용 사례
Tricorder Agent는 MCP 서버를 활용하여 엔지니어의 문제 해결을 지원한다. 알림 정보를 기반으로 관련 로그, 메트릭, 트레이스를 수집하고, 의존성 그래프를 분석하여 문제의 근본 원인을 파악한다. 결과적으로, 엔지니어는 문제 해결 시간 단축과 효율적인 분석을 경험할 수 있다.