아이폰에서 구동되는 Gemma 4, 온디바이스 AI의 새로운 가능성을 열다!
구글의 Gemma 4 모델을 아이폰에서 구동하는 'AI Edge Gallery' 앱 출시
온디바이스(On-device) AI를 통해 데이터 데이터 미저장 정책(Zero-Retention Policy)을 실현하고, 에이전트 스킬(Agent Skills) 및 모바일 액션(Mobile Actions) 지원
사용자들은 성능(Performance)과 발열(Heat), 그리고 앱 안정성(App Stability)에 대한 다양한 의견 제시
애플의 자체 모델(Apple's Foundation Models)과의 비교 및 앱스토어(App Store) UI 품질에 대한 의문 제기
온디바이스(On-device) AI의 장점과 한계
AI Edge Gallery는 Gemma 4 모델을 아이폰에서 직접 실행하여 데이터 미저장 정책(Zero-Retention Policy)을 보장한다. 이를 통해 사용자는 개인 정보 보호를 강화하면서도 고성능 AI 모델(High-performance AI Models)을 경험할 수 있다. 하지만, 댓글에서는 아이폰의 하드웨어 성능(Hardware Performance)에 따라 모델 구동 속도와 발열 문제가 발생할 수 있다는 점을 지적한다. 특히, 대규모 모델(Large Models)을 구동할 때 이러한 문제가 두드러질 수 있다.
에이전트 스킬(Agent Skills) 및 모바일 액션(Mobile Actions)의 활용
AI Edge Gallery는 에이전트 스킬(Agent Skills)을 통해 LLM을 대화형 챗봇에서 능동적인 어시스턴트로 변환한다. 위키피디아 검색(Wikipedia Search), 지도 표시(Interactive Maps) 등의 기능을 제공하며, 사용자는 커뮤니티에서 공유되는 스킬을 활용할 수도 있다. 또한, 모바일 액션(Mobile Actions)을 통해 아이폰의 기능을 제어할 수 있는데, 이는 온디바이스 AI의 실용성(Practicality)을 높이는 중요한 요소로 평가받는다.
성능(Performance) 및 하드웨어(Hardware) 제약
사용자들은 아이폰 16 Pro에서 Gemma-4-E2B-it 모델을 구동했을 때 초당 30 토큰(TPS)의 성능을 보였지만, 발열이 심했다는 점을 언급했다. 이는 온디바이스 AI의 하드웨어 의존성(Hardware Dependency)을 보여주는 사례이다. 또한, 모델의 크기, 아이폰의 GPU 및 NPU 성능(GPU and NPU Performance)에 따라 성능이 달라질 수 있으며, 구형 아이폰에서는 모델 구동이 어려울 수 있다는 점도 지적된다.
앱 안정성(App Stability) 및 사용자 인터페이스(UI) 문제
일부 사용자는 앱의 UI 품질(UI Quality)과 안정성(Stability)에 대한 의문을 제기했다. 특히, 텍스트 렌더링 문제, 생성 중 스크롤 불가, 그리고 모델의 AI 환각(Hallucination) 현상 등이 보고되었다. 또한, 앱스토어 페이지의 UI 디자인(UI Design)이 부자연스럽다는 지적도 있었다. 이러한 문제들은 앱의 사용자 경험(User Experience)을 저해하는 요소로 작용할 수 있다.