Gemma 4로 만든 똑똑한 AI 튜터, 우리 아이의 궁금증을 풀어주다!

by DD
1주 전
조회수 14

6세 자녀의 질문에 답하기 위해 Gemma 4 기반의 어린이용 AI 튜터 Curio Kid를 개발

멀티모달 입력(Multimodal Input) 지원: 음성, 사진, 텍스트 등 다양한 방식으로 질문 가능

안전성(Safety) 확보: 유해 콘텐츠 차단 및 데이터 미저장 정책(Zero-Retention Policy)을 통해 안전한 환경 제공

Gemma 4 모델의 다양한 백엔드(Google AI Studio, OpenRouter, On-device) 지원 및 후처리(Post-processing)를 통한 사용자 경험 개선

멀티모달 입력(Multimodal Input) 아키텍처

Curio Kid는 텍스트, 음성, 이미지 등 다양한 입력 방식을 지원하며, 이는 Gemma 4의 멀티모달 기능을 활용한 것이다.

음성 입력: 음성-텍스트 변환(Speech-to-Text) 기술을 통해 사용자의 음성을 텍스트로 변환

이미지 입력: 카메라를 통해 촬영된 이미지 또는 갤러리에서 선택된 이미지를 분석하여 질문에 활용

텍스트 입력: 사용자가 직접 텍스트를 입력하여 질문 가능

이러한 다양한 입력 방식을 통해 어린이가 보다 쉽고 직관적으로 AI 튜터와 상호작용할 수 있도록 설계되었다.

안전성(Safety) 및 개인정보 보호

Curio Kid는 어린이의 안전을 최우선으로 고려하여 데이터 미저장 정책(Zero-Retention Policy)을 채택하고, 유해 콘텐츠를 차단한다.

시스템 프롬프트(System Prompt): 유해한 답변을 생성하지 않도록 엄격하게 제어

안전성 임계값(Safety Thresholds): Gemini SDK의 안전성 설정을 활용하여 유해 콘텐츠 필터링

개인정보 보호: API 키와 PIN을 암호화된 공유 환경(EncryptedSharedPreferences)에 저장하고, 질문 내역은 로컬 DB에 저장하여 클라우드 백업에서 제외

이러한 안전 장치를 통해 어린이가 안심하고 사용할 수 있는 환경을 제공한다.

Gemma 4 모델 선택 및 백엔드 구성

Curio Kid는 사용자의 환경에 따라 Gemma 4 모델을 선택할 수 있도록 다양한 백엔드를 지원한다.

Google AI Studio: 기본 백엔드로, 무료 사용 가능하며 멀티모달 기능을 제공

OpenRouter: 대체 백엔드로, 다양한 모델을 선택할 수 있는 유연성 제공

On-device: LlmInference 싱글톤(Singleton)을 통해 기기 내에서 모델을 실행하여 개인정보 보호 및 오프라인 사용 지원

모델 선택 및 백엔드 구성**을 통해 사용자는 자신의 환경에 맞는 최적의 성능과 편의성을 선택할 수 있다.

Gemma 4의 한계점 극복: 후처리(Post-processing) 기술

Gemma 4 모델의 답변 생성 과정에서 발생하는 문제점을 해결하기 위해 후처리(Post-processing) 기술을 적용했다.

불필요한 문구 제거: 모델이 생성하는 불필요한 문구(예: "Final Polish:")를 제거하여 깔끔한 답변 제공

스트리밍(Streaming) 처리: Gemini SDK의 80초 소켓 타임아웃(Socket Timeout) 문제를 해결하기 위해 스트리밍 방식을 활용

오류 처리: 4xx/5xx 에러, 안전성 문제, 할당량 초과 등의 오류를 어린이 친화적인 문구로 변환하여 사용자 경험 개선

이러한 후처리 기술을 통해 Gemma 4 모델의 한계를 보완하고, 사용자에게 최적의 경험을 제공한다.

Curio Kid의 기술적 도전 과제

Curio Kid 개발 과정에서 다양한 기술적 도전 과제가 있었으며, 이를 해결하기 위한 노력이 있었다.

체인 오브 씽킹(Chain-of-thought) 문제: Gemma 4가 답변 생성 시 불필요한 문구를 출력하는 문제를 해결하기 위해 cleanLunaReply 함수를 개발

스트리밍(Streaming) 처리: Gemini SDK의 소켓 타임아웃 문제를 해결하기 위해 generateContentStream 사용

오류 처리: 다양한 오류 상황에 대해 친절한 에러 메시지를 제공하여 사용자 경험을 개선

이러한 기술적 도전 과제를 극복함으로써 Curio Kid는 어린이에게 안전하고 유익한 AI 튜터 서비스를 제공할 수 있게 되었다.

My 6-year-old asks 400 questions a day. So I built him a Gemma 4 AI tutor.