TranslateGemma: 55개 언어 지원하는 오픈 번역 모델 출시!

by DD
4개월 전
조회수 92

Gemma 3 기반의 오픈 번역 모델인 TranslateGemma가 4B, 12B, 27B 파라미터 크기로 출시되어 55개 언어 지원을 시작함

12B 모델이 27B 모델보다 우수한 성능을 보이며, 모바일 환경에서도 높은 품질의 번역 제공

Gemini 모델의 지식을 활용한 2단계 미세 조정(Fine-tuning)을 통해 성능과 효율성을 동시에 달성

이미지 내 텍스트 번역에서도 긍정적인 성능을 보이며, 다양한 환경에서 사용 가능

TranslateGemma의 핵심: Gemini 모델의 지식 증류

TranslateGemma는 Gemini 모델의 지식을 활용하여 오픈 아키텍처(Open Architecture)를 구현했다. 특히, 2단계 미세 조정(Fine-tuning) 과정을 통해 번역 품질을 향상시켰다.

SFT(Supervised Fine-Tuning): 다양한 병렬 데이터셋(Parallel Dataset)을 활용하여 광범위한 언어 지원(Broad Language Coverage) 및 높은 정확도(High Fidelity) 달성

RL(Reinforcement Learning): MetricX-QE 및 AutoMQM과 같은 고급 지표를 사용하여 문맥 정확도(Contextual Accuracy)와 자연스러운 번역(Natural-sounding Translation)을 유도

이러한 과정을 통해 모델의 효율성(Efficiency)을 높이면서도 번역 품질을 유지하는 데 성공했다.

성능 분석: 12B 모델이 27B 모델을 능가하는 이유

TranslateGemma는 WMT24++ 벤치마크(Benchmark)를 통해 모델의 성능을 평가했다. 특히, 12B 모델이 27B 모델보다 우수한 성능을 보인 점이 주목할 만하다.

MetricX 지표: 12B 모델이 27B 모델 대비 더 적은 파라미터(Parameter)로 높은 성능을 달성

효율성: 높은 처리량(Throughput)과 낮은 지연 시간(Latency)을 제공하여 개발자 생산성(Developer Productivity) 향상

4B 모델: 모바일 환경(Mobile Environment)에서 12B 모델과 유사한 성능을 보여 다양한 환경(Diverse Environment)에서의 활용 가능성을 입증

이러한 결과는 특화된 훈련 과정(Specialized Training Process)을 통해 얻어진 것으로, 모델의 효율성을 극대화했다.

다양한 환경을 위한 모델 설계

TranslateGemma는 다양한 환경에서 사용될 수 있도록 4B, 12B, 27B 세 가지 크기로 제공된다.

4B 모델: 모바일 및 엣지 환경(Mobile and Edge Deployment)에 최적화

12B 모델: 소비자용 노트북(Consumer Laptop)에서 원활하게 실행되어 로컬 개발 환경(Local Development Environment) 지원

27B 모델: 단일 H100 GPU 또는 클라우드 TPU(Cloud TPU)에서 실행 가능하며, 최대의 번역 품질 제공

이처럼 다양한 크기의 모델을 제공함으로써, 개발자는 자신의 환경에 맞는 모델(Customized Model)을 선택하여 사용할 수 있다.

생태계 확장: 연구 및 개발을 위한 기반

TranslateGemma는 연구자(Researcher)와 개발자(Developer)에게 다양한 번역 관련 작업을 위한 강력한 도구를 제공한다. 특히, 55개 언어 쌍(Language Pair)에 대한 높은 품질의 번역을 지원하며, 추가적으로 500개 이상의 언어 쌍에 대한 연구를 장려한다.

커뮤니티 기여: 기술 보고서(Technical Report)를 통해 커뮤니티 탐구(Community Exploration) 및 추가 연구(Further Research) 장려

파인 튜닝(Fine-tuning): 특정 언어 쌍(Specific Language Pair) 또는 저자원 언어(Low-resource Language)의 품질 향상을 위한 맞춤형 모델 개발(Customized Model Development) 지원

멀티모달 기능: 이미지 내 텍스트 번역(Text within Images)에서도 긍정적인 성능을 보여 다양한 활용 가능성(Versatile Usability) 제시

TranslateGemma는 오픈 번역 모델(Open Translation Model)의 새로운 기준을 제시하며, 지속적인 발전을 위한 기반을 마련했다.

TranslateGemma: A new suite of open translation models