앤트로픽 Fable 5 공개! AI 성능의 새 기준, 가격과 안전장치 논란은?

by DD
2일 전
조회수 32

앤트로픽이 역대 최고 성능의 AI 모델 'Fable 5'와 'Mythos 5'를 공개하며 AI 성능 경쟁에 불을 붙임

Fable 5는 안전장치가 강화된 일반 모델, Mythos 5는 일부 제한 해제된 고성능 모델로 모델 이원화 전략을 사용함

SWE-Bench Pro 80.3% 달성으로 코딩 능력이 크게 향상되었으며, 과학 연구 및 에이전트형 작업에서도 두드러진 성능을 보임

가격은 Opus 4.8의 두 배로 비싸지만, 장기 작업 효율성 증대로 비용 상쇄 가능성 제시

과도한 안전장치(폴백)와 30일 트래픽 보존 정책이 사용자 경험 및 프라이버시에 대한 논란을 야기함

Fable 5와 Mythos 5: 동일 기반, 다른 얼굴

앤트로픽은 Fable 5와 Mythos 5를 동일한 기반 모델(Same Underlying Model)에서 파생시켰으나, 안전장치 적용 여부에 따라 두 모델로 분리함. Fable 5는 일반 사용자에게 공개되며 사이버 보안, 생물·화학 등 고위험 주제에 대한 답변을 제한하는 분류기(Classifier)를 탑재함. 반면 Mythos 5는 이러한 안전장치를 해제하여 극소수의 검증된 파트너에게만 프로젝트 글래스윙(Project Glasswing)을 통해 제공됨. 이러한 이원화 전략은 모델의 잠재적 악용 가능성을 통제하면서도 최고 수준의 AI 성능을 탐구하려는 시도로 해석됨. Fable 5는 위험 주제 감지 시 Opus 4.8로 자동 전환되는 폴백(Fallback) 메커니즘을 갖춤.

SWE-Bench Pro 80.3% 달성: 코딩 및 복잡한 작업 능력

Fable 5와 Mythos 5는 SWE-Bench Pro에서 80.3%라는 역대 최고 점수를 기록하며 이전 모델인 Opus 4.8(69.2%), GPT-5.5(58.6%), Gemini 3.1 Pro(54.2%)를 크게 앞섬. 이는 특히 깃허브 이슈 해결 능력과 같이 길고 복잡한 코딩 작업에서 두드러짐. 또한, 사람의 지시 없이 여러 단계를 스스로 처리하는 에이전트형 작업(Agentic Tasks)에서도 강력한 성능을 보여줌. 스트라이프(Stripe)의 5천만 줄 루비 코드베이스 마이그레이션 사례는 이러한 장기 작업 효율성(Long-term Task Efficiency)을 입증하며, 기존 팀이 두 달 걸릴 작업을 하루 만에 완료했다고 함. 과학 연구 분야에서도 단백질 설계 가속화 및 유전체 모델 성능 향상 등 복잡한 문제 해결 능력이 강조됨.

가격 정책: Opus 4.8의 두 배, 비용 효율성 논란

Fable 5와 Mythos 5의 가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로, Opus 4.8($5/$25)의 정확히 두 배이며 GPT-5.5($5/$30)보다도 비쌈. 앤트로픽은 이를 Mythos 프리뷰 가격의 절반 이하라고 강조하지만, 외신들은 주요 AI 모델 중 가장 비싼 가격이라고 평가함. 특히 6월 23일부터는 Pro, Max, Team 요금제에서 추가 비용 없이 사용 가능했던 Fable 5가 별도 사용량 크레딧(Usage Credits)이 필요하게 되어, '줬다 뺐는다'는 비판과 함께 향후 비용 구조에 대한 계산이 필요함. 다만, 대규모 코드 마이그레이션이나 장기 에이전트 작업처럼 시간 절감 효과가 명확한 경우에는 두 배의 비용을 지불할 가치가 있다는 의견도 존재함.

과도한 안전장치(폴백)와 API 사용 시 고려사항

Fable 5의 안전장치(폴백)는 보안·바이오 등 고위험 주제 감지 시 Opus 4.8로 자동 전환되도록 설계되었으나, 일부 정상적인 질문까지 전환시키는 과도한 보수성으로 초기 사용자들 사이에서 논란이 있음. 앤트로픽은 이를 인정하며 시간을 두고 오탐(False Positive)을 줄이겠다고 밝혔으나, 실제 전환 빈도는 공식 추정치인 5%보다 높다는 사용자 경험이 공유됨. API 사용자는 자동 전환이 지원되지 않아 폴백 파라미터 설정이나 SDK 미들웨어 사용이 필수적임. 또한, Fable 5 및 Mythos 모델은 트래픽을 30일간 의무 보존하며, 이는 학습 외 안전 모니터링 용도로 사용된다고 하나 민감한 데이터를 다루는 조직에게는 프라이버시 우려를 야기할 수 있음.

한국 주요 기관의 Mythos 라인 접근 및 활용

앤트로픽은 프로젝트 글래스윙(Project Glasswing)을 통해 사이버 보안 취약점 발견 및 패치를 목적으로 검증된 조직에게 Mythos 모델 접근 권한을 부여함. 한국의 SK텔레콤, 과학기술정보통신부 산하 한국인터넷진흥원(KISA) 등이 참여를 확정했으며, 삼성전자와 SK하이닉스도 포함된 것으로 보도됨. 이들 기관은 Mythos 프리뷰의 업그레이드 버전인 Mythos 5에 접근하여 사이버 방어 역량을 강화하는 데 활용할 것으로 예상됨. 이는 민감한 프런티어 모델이 통제된 환경 하에서만 공유되는 '통제된 접근 체계(Controlled Access Scheme)'의 일환으로, 관련 논란은 지속될 전망임.

비전과 도구 생성을 넘나드는 AI 능력 시연

앤트로픽은 Fable 5가 별도 보조 장치 없이 게임 화면 픽셀만으로 '포켓몬 파이어레드'를 클리어하는 시연을 공개하며, 복잡한 작업을 혼자 수행하는 에이전트 능력의 향상을 입증함. 더 나아가, Fable 5는 브라우저 기반 CAD 에디터를 직접 코딩으로 개발하고, 해당 에디터 내에서 3D 프린팅 모델을 설계하며 AI 코파일럿까지 통합하는 능력을 보여줌. 이는 단순히 주어진 작업을 처리하는 것을 넘어, 작업 환경과 도구까지 스스로 구축하는 단계로 발전했음을 시사함. 태양계 시뮬레이션 및 '팩토리오' 게임 자동화 사례 역시 이러한 능동적 문제 해결 능력을 뒷받침함.

'미토스'급 '페이블 5' 공개: Opus 4.8의 2배 값을 할 것인가