구글(Google) AI, 이미지 속 모든 것을 한 번에 검색!
구글(Google)의 Circle to Search 및 Lens 기능 업데이트로 이미지 내 여러 객체를 동시에 검색 가능
AI Mode는 이미지 분석 후 여러 개의 시각 검색을 동시에 실행하는 Fan-out 기술을 활용
Gemini 모델은 이미지와 텍스트 쿼리를 분석하여 적절한 검색 도구를 선택하고, 통합된 결과를 제공
쇼핑, 박물관, 베이커리 등 다양한 상황에서 이미지 기반 검색을 통해 상세 정보 획득(Detailed Information) 가능
AI Mode의 핵심: 멀티모달 검색
본문에 따르면 구글(Google)의 AI Mode는 이미지, PDF 등 다양한 형태의 정보를 이해하기 위해 멀티모달 검색(Multimodal Search)을 활용한다.
Gemini 모델(Gemini Model): 이미지와 텍스트 쿼리를 분석하여 의도 파악(Intent Understanding) 및 적절한 검색 도구 선택
Lens의 시각적 전문성(Visual Expertise): 이미지 내 객체 식별 및 상호 연관성 분석(Interrelation Analysis)
AI Mode는 단순한 객체 인식(Object Recognition)을 넘어, 상황 맥락(Context)을 이해하여 보다 정확하고 풍부한 검색 결과를 제공한다.
Fan-out 기술: 동시 다중 검색
AI Mode는 Fan-out 기술을 통해 단일 이미지 내 여러 객체에 대한 다중 검색을 동시에 수행한다.
다중 검색 실행: 이미지 내 각 객체를 개별적으로 식별하고, 각 객체에 대한 개별 검색 쿼리(Individual Search Query) 생성
병렬 처리: 여러 검색 쿼리를 동시에 실행하여 검색 시간 단축(Reduced Search Time)
결과 통합: 각 검색 결과를 취합하여 단일하고 일관된 응답(Cohesive Response) 생성
이러한 방식은 사용자가 여러 번의 검색을 거치지 않고도 원하는 정보를 빠르게 얻을 수 있도록 돕는다.
Gemini 모델의 역할: 이미지 이해
Gemini 모델은 AI Mode의 핵심 엔진으로, 이미지 분석 및 쿼리 이해를 담당한다.
이미지 분석: 이미지 내 객체, 특징, 관계를 파악하여 시각적 정보(Visual Information) 추출
쿼리 이해: 사용자의 텍스트 쿼리를 분석하여 검색 의도(Search Intent) 파악
도구 선택: 이미지 분석 및 쿼리 이해를 바탕으로 적절한 검색 도구(Appropriate Search Tool) 선택
Gemini 모델은 텍스트와 이미지를 융합하여 보다 정확하고 풍부한 검색 결과를 제공하는 데 기여한다.
AI Mode의 활용 사례: 쇼핑, 교육, 정보 탐색
AI Mode는 쇼핑, 교육, 정보 탐색 등 다양한 분야에서 활용될 수 있다.
쇼핑: 패션, 가구 등 스타일 관련 이미지 검색을 통해 제품 정보 및 구매 링크 제공
교육: 박물관, 미술관 등에서 이미지 기반 설명(Image-based Explanation)을 제공하여 학습 효과 증대
정보 탐색: 베이커리, 레스토랑 등에서 메뉴 및 관련 정보(Menu and Related Information)를 이미지 검색을 통해 제공
AI Mode는 사용자가 이미지 한 장으로 다양한 정보를 얻을 수 있도록 돕는 강력한 도구이다.