Claude Code 소스 유출, AI의 '언더커버 모드'와 경쟁사 방어 전략 공개!

by DD
2개월 전
조회수 70

Anthropic의 Claude Code 소스 코드 유출로, 내부 기술 및 제품 로드맵이 공개됨

안티-디스틸레이션(Anti-distillation), 언더커버 모드(Undercover Mode) 등 경쟁사 방어 전략이 드러남

정규 표현식(Regex)을 사용한 감정 분석, 네이티브 클라이언트 인증 등 기술적 특징(Technical Features)이 논의됨

KAIROS와 같은 미출시 기능 공개로, 제품 전략 노출에 대한 우려 제기

안티-디스틸레이션(Anti-distillation) 기술 분석

Anthropic은 경쟁 모델 학습을 방해하기 위해 가짜 도구(Fake Tools)를 주입하는 안티-디스틸레이션 기술을 사용한다. claude.ts 파일 내 `ANTI_DISTILLATION_CC` 플래그가 활성화되면, API 요청에 `fake_tools`를 포함하여 시스템 프롬프트를 오염시킨다. 또한, 베타 버전에서는 서버 측에서 커넥터 텍스트 요약(Connector-Text Summarization)을 통해 API 트래픽을 요약하여, 전체 추론 과정을 숨기는 기술을 적용했다. 하지만, 이러한 기술은 MITM 프록시(MITM Proxy)나 환경 변수 설정을 통해 쉽게 우회될 수 있다는 점이 지적된다.

언더커버 모드(Undercover Mode)의 윤리적 논쟁

undercover.ts 파일에 구현된 언더커버 모드(Undercover Mode)는 Claude Code가 외부 환경에서 사용될 때 Anthropic 관련 정보를 숨긴다. 이 모드는 내부 코드명, 슬랙 채널, 레포지토리 이름, 'Claude Code' 자체를 언급하지 않도록 지시한다. 특히, 강제 해제 기능이 없어, AI가 작성한 코드임을 숨기는 데 악용될 수 있다는 우려가 제기된다. AI 환각(Hallucination)을 방지하기 위한 기술적 조치와는 다른, 윤리적 문제로 이어진다는 비판이 존재한다.

정규 표현식(Regex) 기반 감정 분석의 아이러니

Claude Code는 사용자 불만을 감지하기 위해 정규 표현식(Regex)을 사용한다. `userPromptKeywords.ts` 파일에는 욕설, 비속어 등을 탐지하는 패턴이 포함되어 있다. 커뮤니티에서는 LLM 기업이 정규 표현식을 사용하는 것에 대해 아이러니하다는 반응을 보였다. 하지만, 이는 AI 환각(Hallucination)을 방지하고, 성능 저하를 막기 위한 실용적인 선택으로 해석될 수 있다. AI 모델(AI Model)을 사용한 감정 분석보다 빠르고 비용 효율적이기 때문이다.

네이티브 클라이언트 인증(Native Client Attestation)과 보안

system.ts 파일에서 API 요청은 `cch=00000` 플레이스홀더를 포함하며, Bun의 네이티브 HTTP 스택(Native HTTP Stack)에서 해시로 대체된다. 이는 데이터 격리 아키텍처(Data Isolation Architecture)를 강화하여, 스푸핑된 클라이언트로부터 API 호출을 보호하기 위한 기술이다. 하지만, 컴파일 타임 플래그와 환경 변수를 통해 이 기능을 비활성화할 수 있으며, Bun이 아닌 환경에서는 무력화될 수 있다. OpenCode와의 법적 분쟁에서 기술적 근거가 되었지만, 완벽한 보안을 보장하지는 못한다.

KAIROS: 미출시 자율 에이전트 모드

코드베이스 내에서 KAIROS라는 미출시 자율 에이전트 모드에 대한 언급이 발견되었다. 이 모드는 '야간 메모리 증류(nightly memory distillation)'를 위한 /dream 스킬, 일일 로그, GitHub 웹훅 구독, 백그라운드 데몬 워커, 5분 간격의 크론 스케줄 등을 포함한다. 이는 경쟁사에게 제품 로드맵을 노출하는 것과 같다는 비판이 제기되었다. AI 모델(AI Model)의 자동화된 기능 구현을 위한 기반을 보여주며, 향후 Anthropic의 제품 전략에 대한 중요한 단서를 제공한다.

The Claude Code Source Leak: fake tools, frustration regexes, undercover mode

댓글 0

첫 번째 댓글을 남겨보세요!