Gemini 3.5 Flash, 'Computer Use' 기능 통합과 혹평

Gemini 3.5 Flash에 'Computer Use' 기능이 내장되어 에이전트 구축 및 크로스 플랫폼 상호작용 지원을 발표함

성능 향상과 자동화 작업 지원을 강조했으나, 커뮤니티에서는 실제 성능 및 안정성에 대한 의문이 제기됨

데이터 격리 아키텍처(Data Isolation Architecture) 및 AI 환각(Hallucination) 문제, 경쟁 모델 대비 성능 저하 지적이 다수임

'Computer Use' 용어 및 개념에 대한 비판

다수의 사용자는 'Computer Use'라는 용어 자체가 AI 모델에 의해 명명된 것처럼 부자연스럽고, 이미 오래전부터 컴퓨터는 가치 창출에 사용되어 왔다고 지적한다. 'Agentic computer software interaction'과 같은 더 명확한 용어를 제안하며, 현재의 접근 방식이 AI 에이전트(AI Agent)의 실제 활용 방식과 동떨어져 있다고 비판한다. 이는 마케팅 용어 남발(Marketing Jargon)로 인해 기술의 본질을 흐린다는 의견이다.

실제 성능 및 안정성에 대한 회의론

Gemini 3.5 Flash의 'Computer Use' 기능이 실제로는 간단한 작업조차 실패하거나 오류를 발생시킨다는 경험담이 다수 공유되었다. PDF에서 테이블 추출 실패, `git reset --hard` 명령어 실행 등 예측 불가능한 동작(Unpredictable Behavior)과 AI 환각(Hallucination)으로 인한 데이터 오류 가능성이 제기된다. 이는 데이터 미저장 정책(Zero-Retention Policy) 부재 시 심각한 문제를 야기할 수 있다는 우려로 이어진다.

경쟁 모델 대비 성능 및 기능 부족

커뮤니티에서는 Gemini 3.5 Flash의 성능이 Opus 4.8이나 GPT 5.5와 같은 경쟁 모델에 비해 떨어진다는 분석이 제기되었다. 특히 코딩 작업이나 복잡한 지시사항 이해 능력에서 부족함을 보이며, Codex나 Claude와 같은 모델이 제공하는 코드 분석 및 PR 생성 기능이 Gemini에는 부재하다는 지적이 있다. 이는 개발자 생산성 도구(Developer Productivity Tool)로서의 경쟁력 약화로 이어진다.

보안 및 프롬프트 인젝션 위험

Gemini 3.5 Flash의 'Computer Use' 기능은 데이터 격리 아키텍처(Data Isolation Architecture) 없이 라이브 환경에서 직접 실행될 경우 심각한 보안 위험을 초래할 수 있다는 우려가 크다. 프롬프트 인젝션 공격에 대한 방어책이 충분하지 않으며, 사용자 확인 절차나 자동 중단 기능이 필수적이라는 의견이 나온다. 샌드박싱(Sandboxing) 및 인간 루프 검증(Human-in-the-Loop Verification)과 같은 추가적인 보안 조치가 필요하다는 지적이다.

UI/UX 부재 및 접근성 문제

경쟁 모델들이 제공하는 협업 UI(Co-working UI)나 명확한 인터페이스가 Gemini에는 부재하여 사용성이 떨어진다는 비판이 있다. 또한, TUI(텍스트 기반 사용자 인터페이스)와의 상호작용이나 빌딩에 있어서도 성능이 미흡하다는 의견이 있으며, 이는 사용자 경험(User Experience) 측면에서 큰 단점으로 지적된다. 현재의 접근 방식은 LLM의 OS 인터페이스 활용에 대한 근본적인 이해 부족에서 비롯된 것으로 보인다.