AI 에이전트와 웹사이트 상호작용의 미래, webMCP

웹사이트가 AI 에이전트와의 상호작용을 위해 구조화된 정보 제공 필요성이 대두됨

Google은 Chrome에 webMCP(Web Model Context Protocol) 지원 실험 중이며, 이는 AI 에이전트의 웹사이트 이해를 도움

webMCP는 HTML 메타데이터 또는 JavaScript API를 통해 웹사이트의 가능한 액션을 명시적으로 노출하는 방식임

기존 웹사이트는 AI 에이전트가 페이지를 스크래핑하고 추측해야 하는 비효율성 존재

webMCP는 점진적 향상(Progressive Enhancement)으로, 기존 사용자 경험에 영향을 주지 않음

webMCP의 작동 원리 및 필요성

기존 웹사이트는 AI 에이전트가 페이지를 탐색하고 중요 요소를 식별하는 데 많은 시간과 비용을 소모하며, 이는 스크래핑(Scraping) 및 추측(Guessing) 과정의 비효율성을 야기함. webMCP는 웹사이트가 구조화된 정보(Structured Information)를 통해 에이전트에게 사용 가능한 액션(Available Actions)을 명시적으로 제공함으로써 이러한 문제를 해결함. 이는 마치 웹사이트가 AI 에이전트를 위한 명확한 API(Explicit API)를 제공하는 것과 같으며, 상호작용의 신뢰성과 속도를 크게 향상시킬 수 있음.

webMCP 구현 방식: 선언형 vs 명령형 API

webMCP는 두 가지 주요 구현 방식을 제공함. 첫째, HTML 어노테이션(HTML Annotations)을 통한 선언형 API는 UI 요소에 직접 메타데이터를 추가하여 에이전트가 요소의 목적을 이해하도록 함. 둘째, JavaScript 도구(JavaScript Tools)를 통한 명령형 API는 애플리케이션 코드에서 직접 MCP 도구를 등록하고 설명하는 방식임. 데모에서는 후자의 방식을 사용하여 `hire_employee`, `fire_employee`와 같은 직관적인 함수 호출 형태로 액션을 노출했으며, 이는 개발자 경험(Developer Experience) 측면에서 유리함.

AI 에이전트 연동 및 활용 시나리오

webMCP는 Gemini API와 같은 AI 모델과 연동하여 실제 에이전트의 웹사이트 제어를 가능하게 함. 'LinkedIn CEO' 시나리오에서는 에이전트가 제공된 도구를 활용하여 직접적인 의사결정을 내리는 모습을 보여줌. 또한, '직원 신뢰 회복' 시나리오에서는 복잡한 목표 달성을 위해 여러 도구를 조합하는 능력을 시연함. 이는 AI 에이전트가 단순 정보 소비를 넘어 능동적인 웹사이트 상호작용을 수행할 수 있음을 시사함.

webMCP의 점진적 향상(Progressive Enhancement) 철학

webMCP는 실험적인 기술이지만, 기존 웹사이트의 접근성(Accessibility) 기능 강화와 유사한 철학을 따름. 즉, webMCP 지원은 AI 에이전트에게만 추가적인 이해 능력을 제공하며, 일반 사용자에게는 기존 웹사이트 경험에 아무런 변화를 주지 않음. 이는 기존 인프라와의 호환성(Compatibility)을 유지하면서 미래 기술을 점진적으로 도입할 수 있는 유연성을 제공함.

webMCP의 미래 전망 및 과제

webMCP가 웹 개발의 표준으로 자리 잡을지는 아직 불확실함. AI 에이전트의 웹사이트 상호작용이 보편화될 경우, webMCP와 같은 구조화된 인터페이스의 중요성은 커질 것임. 하지만 기술의 실험적 성격과 Chrome Canary/Beta 등 특정 환경에서의 제한적 지원은 광범위한 채택에 걸림돌이 될 수 있음. 향후 표준화 노력과 실제 적용 사례가 성공적으로 축적된다면 웹 개발의 새로운 패러다임이 될 가능성이 있음.