Gemini, 이제 텍스트로 음악을 만든다!

구글(Google) Gemini 앱에 딥마인드(DeepMind)의 Lyria 3를 활용한 음악 생성 기능이 추가됨

텍스트 프롬프트(Text Prompt) 또는 사진/비디오 업로드(Photo/Video Upload)를 통해 30초 길이의 음악 트랙(Music Track) 생성 가능

가사 자동 생성(Lyrics Generation), 스타일/보컬/템포(Style/Vocals/Tempo) 제어 등 창작 기능 강화

SynthID 워터마크(Watermark)를 통해 AI 생성 콘텐츠(AI-Generated Content) 식별 기능 제공

Lyria 3의 음악 생성 원리

Lyria 3는 딥마인드(DeepMind)가 개발한 생성형 음악 모델(Generative Music Model)로, 텍스트 프롬프트(Text Prompt)를 기반으로 30초 길이의 음악 트랙을 생성한다. 사용자는 장르, 분위기, 특정 상황 등을 묘사하여 가사와 멜로디를 생성할 수 있으며, 사진이나 비디오를 업로드하여 시각적 요소(Visual Element) 기반의 음악을 만들 수도 있다. Lyria 3는 기존 Lyria 모델 대비 가사 자동 생성, 창작 요소 제어, 현실적인 트랙 생성 기능을 제공한다.

SynthID를 활용한 AI 생성 콘텐츠 식별

Gemini 앱에서 생성된 모든 음악 트랙에는 SynthID 워터마크(Watermark)가 삽입되어 AI 생성 콘텐츠임을 식별할 수 있다. 사용자는 Gemini 앱에 파일을 업로드하여 SynthID 탐지(SynthID Detection)를 수행하고, AI 생성 여부를 확인할 수 있다. 이는 AI 생성 콘텐츠의 저작권(Copyright) 및 진위 여부(Authenticity)를 판단하는 데 도움을 주며, AI 기술의 책임감 있는 사용(Responsible AI Usage)을 위한 구글(Google)의 노력의 일환이다.

YouTube Shorts와의 통합 및 활용

Lyria 3는 유튜브(YouTube)의 Dream Track 기능에도 통합되어, 크리에이터(Creator)들이 숏폼 영상(Shorts Video)에 맞춤형 사운드트랙(Custom Soundtrack)을 추가할 수 있도록 지원한다. 사용자는 Lyria 3를 통해 가사, 배경 음악 등을 세부적으로 조정(Fine-tuning)하여 숏폼 영상의 창의성(Creativity)을 극대화할 수 있다. 현재 미국(U.S.)을 시작으로, 점차 다른 국가의 크리에이터들에게도 해당 기능이 제공될 예정이다.

책임감 있는 AI 개발을 위한 노력

구글(Google)은 Lyria 3 개발 과정에서 음악 커뮤니티(Music Community)와의 협력을 통해 저작권(Copyright) 및 파트너십(Partnership) 관련 문제에 유의하며 기술을 개발해왔다. Lyria 3는 기존 아티스트(Artist)의 음악을 모방하는 것이 아닌, 창의적인 영감(Creative Inspiration)을 제공하는 것을 목표로 한다. 또한, 특정 아티스트의 이름을 언급하는 경우, 유사한 스타일이나 분위기의 음악을 생성하며, AI 환각(Hallucination)을 방지하기 위한 필터(Filter)를 적용한다.