AI 에이전트 제작부터 배포까지, 구글의 노하우를 CLI로 가져다 쓰세요!

by DD
2시간 전
조회수 10

앤트로픽(Anthropic)의 최신 모델 Claude Fable 5가 보안 문제로 중단되었다가 7월 1일 재개되었으나, 주간 한도 50% 제한으로 아쉬움이 남음

AI 화면 생성 시 발생하는 슬롭(Slop) 현상을 해결하기 위해 Atlassian은 DESIGN.md 형식을 테스트했으나, 프로덕션 환경에서는 비용 및 일관성 이슈 발생

구글이 공개한 google/agents-cli는 AI 에이전트 제작부터 평가, 배포, 운영까지 전 과정을 자동화하는 CLI 도구임

Claude Fable 5 재개와 프로모션 조건 분석

앤트로픽(Anthropic)의 최신 모델 Claude Fable 5가 보안 문제로 잠시 중단된 후 7월 1일 재개되었으나, 주간 사용 한도의 50%까지만 무료로 제공되는 프로모션 조건에 대한 아쉬움이 존재함.

프로모션 기간: 7월 7일 밤까지 (태평양 시간 기준)

적용 플랜: Pro, Max, Team, 일부 Enterprise 플랜

사용처: 웹, 모바일, 데스크톱, Claude Code 등 다양한 환경 지원

제한 사항: Fable 5는 다른 모델보다 주간 한도를 빠르게 소진하며, 프로모션 종료 후에는 사용 크레딧으로만 이용 가능함. API 사용은 프로모션 대상에서 제외됨.

결과적으로, 대규모 프로젝트보다는 궁금했던 어려운 작업에 최신 모델의 성능을 시험해보는 용도로 활용하는 것이 권장됨.

AI 생성 화면의 슬롭(Slop) 현상과 DESIGN.md의 한계

AI가 생성하는 화면 결과물이 기능은 하지만 특색 없는 슬롭(Slop) 현상을 보이는 이유는 브랜드 맥락(Brand Context) 부족 때문임. Atlassian은 이를 해결하기 위해 DESIGN.md 형식을 테스트했으나, 프로덕션 환경에서는 비용 및 일관성 측면에서 불리하다는 결론에 도달함.

DESIGN.md 장점: 빠른 프로토타이핑(Rapid Prototyping) 및 브랜드 스타일 적용에 용이

DESIGN.md 단점:

맥락을 매번 통째로 로드하여 토큰(Token) 사용량 증가

파일 크기 제한으로 인한 중요 설명 누락 가능성

AI가 기존 컴포넌트 대신 유사한 새 컴포넌트 생성 경향

결론적으로, DESIGN.md는 낯선 도구에서의 프로토타입 제작에 적합하며, 프로덕션 환경에서는 필요한 맥락만 선택적으로 제공하는 방식이 더 효율적임.

google/agents-cli: AI 에이전트 개발 라이프사이클 자동화

구글이 공개한 google/agents-cli는 AI 에이전트의 개발, 평가, 배포, 운영 과정을 자동화하는 CLI 도구임. 코딩 에이전트 자체라기보다는, 사용자의 코딩 도구에 스킬을 추가하여 에이전트 개발 워크플로우를 간소화함.

주요 기능:

에이전트 프로젝트 뼈대 생성 및 ADK 코드 작성 지원

LLM-as-judge 방식의 성능 평가 자동화 (데이터 생성, 채점, 비교, 원인 분석, 프롬프트 수정)

Cloud Run, GKE를 통한 클라우드 배포 및 Gemini Enterprise 게시 지원

배포 후 상태 모니터링 및 전체 과정 통합 관리

이 도구는 복잡한 명령어 암기 없이 평소 사용하던 코딩 도구에 부탁하는 방식으로 에이전트 개발 전 과정을 처리할 수 있게 함.

AI 에이전트 성능 평가의 중요성과 자동화 방안

AI 에이전트 개발 후 실제 동작 검증 및 운영 단계는 많은 노력을 요구하며, agents-cli는 이 과정을 중요하게 다룸. 특히 성능 평가 단계에서는 다음과 같은 자동화된 절차를 제공함.

1. 평가 데이터셋 생성

2. LLM 기반 채점(LLM-as-judge)을 통한 결과 평가

3. 이전 버전과의 결과 비교 분석

4. 실패 사례 그룹화 및 원인 분석

5. 분석 결과를 바탕으로 프롬프트 자동 최적화

이러한 자동화된 평가는 일관성 있는 에이전트 성능 유지와 개발 생산성 향상에 기여하며, 사람이 직접 수행할 때 발생할 수 있는 편향이나 실수를 줄여줌.

구글이 공개한 AI 에이전트 제작 노하우를 가져다 쓰는 법