AI 에이전트를 위한 브라우저, Cloudflare Browser Run 출시!

by DD
1개월 전
조회수 18

Cloudflare는 AI 에이전트(AI Agents)를 위한 브라우저, Browser Run을 출시하여 웹 접근성 개선

Chrome DevTools Protocol(CDP) Endpoint 지원으로 에이전트가 브라우저를 직접 제어 가능하며, WebMCP를 통해 웹사이트와 에이전트 간의 상호 작용을 향상시킴

Live View, Human in the Loop, Session Recordings 등 디버깅 및 사용자 개입 기능 강화

기존 Browser Rendering에서 이름 변경 및 동시 브라우저 실행 수 증가(30개 → 120개)

CDP(Chrome DevTools Protocol)를 통한 브라우저 제어

Browser Run은 Chrome DevTools Protocol(CDP)를 직접 노출하여 AI 에이전트가 브라우저를 세밀하게 제어할 수 있도록 지원한다. CDP는 브라우저 자동화의 핵심 프로토콜로, Puppeteer, Playwright와 같은 라이브러리의 기반이 된다.

CDP Endpoint: 기존 CDP 자동화 스크립트(Automation Scripts)를 별도 인프라 관리 없이 Browser Run에 연결 가능

MCP Client 지원: Claude Desktop, Cursor 등 AI 코딩 에이전트(AI Coding Agents)가 원격 브라우저로 활용 가능

장점: JavaScript 디버깅(Debugging) 및 토큰 효율적인 브라우저 제어 가능

CDP를 직접 사용하면, 기존 라이브러리에서 제공하지 않는 기능을 활용할 수 있으며, Cloudflare Worker 환경에서도 쉽게 연동할 수 있다.

WebMCP를 활용한 에이전트 친화적 웹 환경 구축

Cloudflare는 AI 에이전트의 웹 탐색(Web Navigation) 신뢰성을 높이기 위해 WebMCP(Web Model Context Protocol) 지원을 시작했다. WebMCP는 웹사이트가 에이전트에게 제공할 수 있는 기능을 선언하는 새로운 브라우저 API이다.

navigator.modelContext: 웹사이트가 자체 도구를 등록

navigator.modelContextTesting: 에이전트가 등록된 도구를 발견하고 실행

장점: UI 변경에 유연하게 대응하며, 빠르고 안정적인 웹 탐색 가능

WebMCP를 통해 에이전트는 UI를 분석하는 대신, 사이트가 제공하는 도구를 직접 호출하여 웹 탐색의 효율성(Efficiency)을 높일 수 있다.

Live View 및 Session Recordings를 통한 디버깅 및 관찰 기능 강화

Browser Run은 AI 에이전트의 동작을 실시간으로 관찰하고, 문제 발생 시 디버깅을 돕기 위해 다양한 기능을 제공한다.

Live View: 에이전트의 브라우저 세션을 실시간으로 확인하며, DOM, 콘솔, 네트워크 요청(Network Requests)을 모니터링

Session Recordings: DOM 변경, 사용자 상호 작용, 페이지 이동을 JSON 형식으로 기록하여 세션 종료 후에도 재현 가능

Dashboard Redesign: Screenshot, PDF, Markdown, Crawl 등 다양한 요청에 대한 로그를 통합하여 관리

이러한 기능을 통해 개발자는 에이전트의 동작을 쉽게 파악하고, 문제 발생 시 빠르게 원인을 분석(Root Cause Analysis)할 수 있다.

Human in the Loop를 통한 자동화 워크플로우 개선

Browser Run은 AI 에이전트가 처리하기 어려운 상황에 대해 사람의 개입을 허용하는 Human in the Loop 기능을 제공한다. 이를 통해 자동화의 한계를 보완하고, 보다 유연한 워크플로우를 구축할 수 있다.

Human in the Loop: 에이전트가 특정 문제(로그인, 예외 상황)에 직면했을 때, 사람에게 제어 권한을 넘겨 문제 해결

Handoff Flow: 에이전트가 도움을 요청하고, 사람이 개입한 후 다시 제어 권한을 넘겨받는 기능 추가 예정

활용 사례: Amazon에서 오렌지색 용암 램프를 검색하고, 로그인 필요 시 사람에게 제어 권한을 넘기는 시나리오

이러한 기능을 통해 AI 에이전트는 자동화의 효율성을 유지하면서, 예외 상황에 대한 유연성(Flexibility)을 확보할 수 있다.

확장된 동시 실행 환경 및 향후 계획

Cloudflare는 Browser Run의 성능 향상을 위해 동시 브라우저 실행 제한을 대폭 늘리고, 향후 기능 확장을 계획하고 있다.

Higher Limits: 기본 동시 브라우저 실행 수를 30개에서 120개로 증가

Quick Actions: 초당 요청 처리량 10건으로 증가

향후 계획: Human in the Loop Handoff, Session Recordings Inspection, Traces and Browser Logs, Workers Bindings 지원 예정

이러한 개선 사항을 통해 개발자는 더 많은 작업을 동시에 처리하고, AI 에이전트의 성능(Performance)을 극대화할 수 있다.

Browser Run: give your agents a browser