오픈AI, GPT-5.4 mini·nano 출시! 소형 모델 성능 대폭 향상

오픈AI(OpenAI)가 GPT-5.4 mini와 nano, 두 가지 소형 모델을 출시하여 모델 라인업 확장

GPT-5.4 mini는 코딩, 추론, 멀티모달, 도구 사용 전반에서 성능 개선을 이루었으며, 이전 모델 대비 2배 이상 빠른 속도를 제공

GPT-5.4 nano는 분류, 데이터 추출, 랭킹 등 속도와 비용 효율성이 중요한 작업에 최적화되었으며, API 전용으로 제공

두 모델 모두 지연 시간이 중요한 워크로드에 맞춰 설계되었으며, ChatGPT, Codex 등 다양한 서비스에 통합

GPT-5.4 mini: 성능과 속도의 균형

GPT-5.4 mini는 코딩, 추론, 멀티모달, 도구 사용 전반에서 성능 향상을 이루었으며, 이전 GPT-5 mini 대비 2배 이상 빠른 속도를 제공한다. SWE-Bench Pro에서 54.4%를 기록하여 이전 GPT-5 mini(45.7%)를 크게 앞섰으며, 풀 모델 GPT-5.4(57.7%)에 근접한 성능을 보였다. 데스크톱 조작 능력을 측정하는 OSWorld-Verified에서는 72.1%를 기록하여 플래그십 모델(75.0%)에 근접하고 인간 기준(72.4%)을 상회했다. 특히, 타깃 편집, 코드베이스 탐색, 프론트엔드 생성, 디버깅 루프와 같이 지연 시간이 중요한 작업에 활용될 수 있다.

GPT-5.4 nano: 비용 효율성을 극대화

GPT-5.4 nano는 분류, 데이터 추출, 랭킹, 단순 서브에이전트와 같이 속도와 비용이 최우선인 작업에 최적화되었다. SWE-Bench Pro 52.4%, OSWorld 39.0%를 기록하며 mini보다는 낮지만, 이전 nano급 모델 대비 크게 향상되었다. API 전용으로 제공되며, 입력 백만 토큰당 $0.20, 출력 백만 토큰당 $1.25의 저렴한 가격으로 제공된다. ChatGPT Free 및 Go 사용자는 Thinking 메뉴(+ 버튼)에서 GPT-5.4 mini를 이용할 수 있으며, ChatGPT 유료 구독자는 GPT-5.4 사용량 초과 시 GPT-5.4 mini로 자동 대체된다.

멀티모델 시스템(Multi-model System)의 부상

오픈AI(OpenAI)는 소형 모델의 성능 향상에 따라, 하나의 모델로 모든 것을 처리하는 대신 역할을 분리해 구성하는 멀티모델 시스템(Multi-model System)이 더 실용적으로 작동한다고 밝혔다. Codex에서 GPT-5.4가 계획, 조율, 최종 판단을 담당하고, GPT-5.4 mini 서브에이전트들이 코드베이스 검색, 파일 검토, 문서 처리를 병렬로 처리하는 방식이 대표적이다. 소형 모델은 지연 시간(Latency)에 민감한 작업을 담당하고, 대형 모델은 복잡한 추론을 처리하는 방식으로, 전반적인 시스템 효율성(System Efficiency)을 향상시킨다.

GPT-5.4 mini의 Codex 활용 사례

GPT-5.4 mini는 Codex에서 GPT-5.4 대비 쿼터(Quota) 30%만 소진하여 비용 효율성(Cost Efficiency)을 극대화한다. 오픈AI(OpenAI)는 코딩 어시스턴트의 즉각적인 반응, 서브에이전트의 빠른 작업 처리, 스크린샷 기반 컴퓨터 조작처럼 지연 시간이 제품 경험을 좌우하는 워크로드에 맞게 두 모델을 설계했다. 특히, GPT-5.4 mini는 코드베이스 탐색, 프론트엔드 생성, 디버깅 루프와 같은 작업에서 낮은 지연 시간을 제공하여 개발 생산성을 향상시킨다. 이는 개발자 경험(Developer Experience) 개선에 기여한다.