GPT-5.4, AI가 직접 컴퓨터를 조작한다!

by DD
2개월 전
조회수 44

GPT-5.4는 코딩, 추론, 컴퓨터 조작을 통합하여 복잡한 작업 처리 능력을 향상시킴

네이티브 컴퓨터 사용 기능을 통해 스크린샷 기반 데스크톱 환경 조작 및 Playwright 활용 코드 기반 조작 가능

개선된 성능: GPT-5.2 대비 개별 팩트 오류 33% 감소, 전체 응답 오류 18% 감소

API Tool Search 도입으로 토큰 사용량 47% 감소 및 정확도 유지를 달성

ChatGPT Plus, Team, Pro 구독자에게 GPT-5.4 Thinking 순차 제공, 2026년 6월 5일 GPT-5.2 Thinking 종료

GPT-5.4의 핵심: 네이티브 컴퓨터 사용 기능

GPT-5.4는 오픈AI(OpenAI) 범용 모델 중 최초로 네이티브 컴퓨터 사용(Computer Use) 기능을 내장하여, 스크린샷을 읽고 마우스 및 키보드 명령을 통해 데스크톱 환경을 직접 조작할 수 있다.

Playwright 통합: Playwright(Playwright) 같은 라이브러리를 활용한 코드 기반 조작 지원

벤치마크 결과: OSWorld-Verified 75.0%, WebArena-Verified 67.3%, Online-Mind2Web 92.8% 달성

이 기능은 AI 에이전트(AI Agent)의 실질적인 활용 범위를 대폭 확장하며, 기존 API 기반 작업의 한계를 극복하는 데 기여한다.

GPT-5.4의 성능 향상: 정확성과 효율성

GPT-5.4는 GPT-5.2 대비 개별 팩트 오류 33% 감소, 전체 응답 오류 포함 확률 18% 감소를 달성하여 응답 정확도(Response Accuracy)를 개선했다.

SWE-Bench Pro: GPT-5.3-Codex 대비 소폭 향상(57.7% vs 56.8%)

GDPval: 83.0% 기록, GPT-5.2 대비 12.1%p 향상

투자은행 스프레드시트 모델링: 87.3% 기록, GPT-5.2 대비 18.9%p 향상

이러한 성능 향상은 AI 환각(Hallucination) 감소와 더불어, 실제 업무 적용 시 신뢰도를 높이는 데 기여한다.

API Tool Search: 비용 절감과 속도 개선

GPT-5.4는 API에서 Tool Search(Tool Search) 기능을 도입하여, 도구(Tool)가 많아질수록 발생하는 비용과 지연 문제를 해결했다.

기존 방식: 모든 도구 정의를 프롬프트에 포함 → 토큰 사용량 증가 및 응답 지연 발생

Tool Search: 가벼운 도구 목록과 검색 기능만 사용, 실제 도구 정의는 필요 시 로드

벤치마크 결과: 36개 MCP 서버, 250개 태스크에서 토큰 사용량 47% 감소, 정확도 유지

이는 대규모 도구 생태계 위에서 에이전트(Agent)를 구축하는 개발자에게 비용 절감(Cost Reduction)과 응답 속도 향상(Response Speed)을 제공한다.

GPT-5.4의 생태계 확장: ChatGPT for Excel

GPT-5.4는 엔터프라이즈(Enterprise) 고객을 위해 ChatGPT for Excel 애드인(Add-in)을 출시하고, FactSet, MSCI, Moody's 등 금융 데이터 앱 연동을 지원한다.

ChatGPT Plus, Team, Pro: GPT-5.4 Thinking 순차 배포

Enterprise, Edu: 관리자 설정에서 얼리 액세스 활성화

API: gpt-5.4, gpt-5.4-pro

Codex: 앱, CLI, IDE 확장, 웹 모두 지원

이러한 생태계 확장은 GPT-5.4의 활용 범위를 넓히고, 생산성 향상(Productivity Improvement)을 위한 다양한 기회를 제공한다.

GPT-5.4의 기술적 특징: 모델 통합과 속도 개선

GPT-5.4는 GPT-5.3-Codex의 코딩 능력을 흡수한 최초의 메인라인 추론 모델로, 코딩, 추론, 에이전트 워크플로우, 컴퓨터 조작을 하나의 모델에 통합했다.

Codex /fast 모드: 토큰 처리 속도 최대 1.5배 향상

Playwright (Interactive) 실험적 공개: 웹 및 Electron 앱 시각적 디버깅, 빌드 중인 앱 테스트 지원

100만 토큰 컨텍스트 윈도우 지원: API, Codex 프리뷰

이러한 기술적 특징은 개발 생산성(Development Productivity)을 높이고, 복잡한 작업 처리 능력을 향상시키는 데 기여한다.

[릴리즈 노트] AI가 직접 컴퓨터 조작, 오픈AI GPT-5.4 출시

댓글 0

첫 번째 댓글을 남겨보세요!