Claude 앱 게이트웨이 출시: 클라우드 AI 접근 및 비용 관리 간소화

by DD
23시간 전
조회수 2

개발자별 클라우드 자격 증명 관리 및 설정 푸시의 수동적 운영 부담 해소를 위해 게이트웨이 도입

SSO 로그인, 중앙 집중식 정책 적용, 역할 기반 접근 제어를 제공하는 셀프 호스팅 제어 플레인(Control Plane) 구현

사용자별 비용 추적 및 지출 한도 설정 기능으로 클라우드 AI 서비스 사용량 관리 효율화

Claude 앱 게이트웨이의 아키텍처 및 배포

본문에서는 Claude 앱 게이트웨이가 단일 상태 비저장 컨테이너(Stateless Container)로 배포되며, PostgreSQL 데이터베이스를 백엔드로 사용한다고 설명함.

셀프 호스팅 제어 플레인(Self-hosted Control Plane): 기업의 자체 인프라에 배포하여 데이터 통제권 확보

PostgreSQL 백엔드: 사용자 정보, 정책 설정, 사용량 데이터 등을 저장하여 데이터 영속성(Data Persistence) 보장

클라이언트 통합: 기존 Claude 바이너리에 포함되어 별도 설치 없이 간편한 도입(Easy Adoption) 가능

이러한 아키텍처는 중앙 집중식 관리(Centralized Management)확장성(Scalability)을 동시에 제공함.

보안 강화: SSO 및 정책 기반 접근 제어

게이트웨이는 기업의 ID 공급자(Identity Provider, IdP)와 연동하여 OpenID Connect(OIDC) 기반의 인증을 수행함.

SSO 통합: Google Workspace, Microsoft Entra ID, Okta 등 표준 OIDC 공급자와 호환되어 기업 SSO 로그인 지원

세션 관리: 단기 세션 토큰을 발급하여 개발자 머신에 장기 비밀 키(Long-lived Secret)를 저장하지 않음

중앙 집중식 정책 관리: 허용 모델, 기본 설정 등 관리 설정을 서버에서 한 번 정의하면 모든 클라이언트가 자동으로 정책을 수신하고 적용받음

이를 통해 일관된 보안 정책 적용(Consistent Policy Enforcement)접근 통제(Access Control)가 가능해짐.

다중 클라우드 라우팅 및 장애 조치 기능

게이트웨이는 업스트림 자격 증명(Upstream Credential)을 보유하고, 추론 요청을 Claude API, Amazon Bedrock, Google Cloud 중 하나로 라우팅함.

유연한 라우팅: 다중 클라우드 환경 지원으로 특정 공급자에 종속되지 않고 최적의 서비스 선택 가능

장애 조치(Failover) 기능: 특정 API 엔드포인트에 장애 발생 시 다른 제공자로 자동 전환하여 서비스 연속성 확보

데이터 미저장 정책(Zero-Retention Policy): 사용자가 명시적으로 구성하지 않는 한, 추론 트래픽이나 사용량 데이터는 Anthropic으로 전송되지 않음

이 기능은 안정적인 서비스 운영(Stable Service Operation)비용 효율적인 자원 활용(Cost-effective Resource Utilization)을 지원함.

사용자별 비용 추적 및 지출 한도 설정

게이트웨이는 각 요청에 사용자별 사용량 메트릭을 포함시켜, 구성된 수집기로 전달함.

사용량 데이터 수집: OTLP(OpenTelemetry Protocol)를 통해 사용자별 사용량 데이터를 수집하고, 기업의 데이터 보존 정책(Retention Schedule)에 따라 관리

비용 할당(Cost Attribution): 사용자, 그룹, 조직별로 정확한 비용 추적 및 할당 가능

지출 한도(Spend Caps): 일별, 주별, 월별 비용 상한선 설정으로 예산 초과 방지

이를 통해 AI 서비스 비용 투명성(AI Service Cost Transparency)을 높이고 예산 관리(Budget Management) 효율성을 극대화할 수 있음.

Introducing the Claude apps gateway for Amazon Bedrock and Google Cloud