시각 장애인 러너를 위한 AI 러닝 코치, Running Guide agent
시각 장애인(Blind and Low-Vision, BLV) 러너의 독립적인 러닝을 돕는 Running Guide agent 출시
온디바이스(On-device) 엣지 컴퓨팅(Edge Computing) 기반의 안전성(Safety) 중심 하이브리드 아키텍처(Hybrid Architecture) 채택
Gemma 4 E4B를 활용한 멀티모달(Multimodal) 분석으로 실시간 환경 이해 및 지능형 코칭(Intelligent Coaching) 제공
지능형 안경(Intelligent Eyewear) 프로토타입 개발 및 SG Enable과의 협력을 통한 사용자 중심 설계
안전성을 위한 하이브리드 아키텍처(Hybrid Architecture)
Running Guide agent는 온디바이스(On-device) 엣지 컴퓨팅(Edge Computing)을 통해 안전성을 확보하고, Gemma 4 E4B를 활용하여 고차원적인 환경 이해를 수행한다.
온디바이스(On-device) 모델: Pixel 10 Pro의 커스텀 실리콘(Custom Silicon)에서 실행되어 초저지연(Ultra-low Latency)의 안전성을 보장하며, 통신 불가능 환경에서도 즉각적인 알림(Immediate Alerts) 제공
Gemma 4: 멀티모달(Multimodal) 입력(Image and Text)을 처리하여 고차원적인 장면 이해를 수행하며, Smarter Frame Selection을 통해 처리량(Throughput)을 최적화
이러한 하이브리드 방식은 안전(Safety)과 성능(Performance)의 균형을 맞추는 핵심 전략이다.
멀티 에이전트(Multi-agent) 프레임워크(Framework) 설계
Running Guide agent는 Planner, Coach, Break agent로 구성된 멀티 에이전트(Multi-agent) 프레임워크(Framework)를 통해 다양한 기능을 제공한다.
Planner agent: Gemma 4의 Function Calling을 활용하여 날씨 및 지도 데이터를 수집하고, 러너와 대화하며 운동 목표 설정
Coach agent: DANGER, WARNING, NOTICE의 3단계 알림 계층 구조를 통해 실시간 코칭 제공
Break agent: 러닝 세션의 일시 중지 및 재개 관리
각 에이전트는 특정 역할(Specific Role)에 집중하여 시스템의 확장성(Scalability)과 유지보수성(Maintainability)을 향상시킨다.
지능형 안경(Intelligent Eyewear) 프로토타입
현재 Pixel 10 Pro를 기반으로 하지만, 지능형 안경(Intelligent Eyewear) 프로토타입을 통해 시야각(Field of View)을 개선하고 있다.
넓은 시야각(Wider Field of View): 멀티모달(Multimodal) 모델에 더 많은 데이터를 제공하여 정확도(Accuracy) 향상
엣지 컴퓨팅(Edge Computing)과의 연동: 안경에서 획득한 데이터를 Pixel 10 Pro로 직접 스트리밍하여 원활한 하드웨어-AI 통합(Hardware-AI Integration) 구현
지능형 안경은 사용자 경험(User Experience)을 극대화하고, AI 모델의 성능을 향상시키는 중요한 요소이다.
커뮤니티(Community)와의 협력
Google은 SG Enable과의 파트너십을 통해 사용자 중심의 제품 설계를 지향한다.
실사용자(BLV 러너) 피드백: 엔지니어링 팀과 BLV 러너 간의 직접적인 소통을 통해 실제 요구사항(Real Needs)을 반영
반복적인 설계(Iterative Design): 사용자 피드백을 기반으로 지속적인 개선을 통해 제품 완성도(Product Quality) 향상
이러한 협력은 기술의 사회적 가치(Social Value)를 높이고, 제품의 성공 가능성(Success Probability)을 높이는 데 기여한다.