리우 LLM, '독자 개발' 주장 뒤에 숨겨진 진실은?

by DD
3시간 전
조회수 2

리우데자네이루 시가 공개한 'Rio-3.5-Open-397B' 모델이 독자 개발이 아닌 기존 모델 병합이라는 의혹 제기

Nex 모델과 Qwen3.5 모델의 가중치(Weights)를 단순 병합한 결과이며, 자체 학습 증거 부족 지적

모델 자체 식별 결과 및 가중치 분석을 통해 의혹의 신빙성(Credibility)이 높다는 커뮤니티 반응

오픈소스 모델 생태계에서의 투명성 및 저작권 문제에 대한 논쟁 촉발

모델 가중치 병합(Weight Merging)의 기술적 함의

커뮤니티에서는 모델 가중치(Model Weights)의 단순 선형 결합만으로도 기존 모델의 성능을 저하시키지 않고 오히려 향상시킬 수 있다는 점에 주목하고 있습니다. 이는 딥러닝 모델의 견고성(Robustness)을 보여주는 사례로 언급되며, 0.6 Nex / 0.4 Qwen 비율로 병합된 가중치가 60개 레이어 전체에 걸쳐 일관되게 발견된다는 분석이 제시되었습니다. 이러한 가중치 보간(Weight Interpolation) 방식은 일반적인 파인튜닝(Fine-tuning)과는 다른 접근법으로, 모델 아키텍처(Model Architecture)의 유연성을 시사합니다.

투명성 부족과 오해의 소지

초기 발표에서 Nex 모델과의 병합 사실을 공개하지 않은 점이 주요 논란거리입니다. 일부에서는 Nex 모델 역시 Qwen 기반이므로, 단순히 두 모델을 병합한 것이라면 Nex Pro를 숨길 이유가 없다고 지적합니다. 또한, On-Policy Distillation을 통한 개선 가능성도 제기되었으나, 업로드된 모델에서는 해당 과정이 누락되어 혼란을 가중시켰다는 분석이 있습니다. 이러한 정보 공개의 불투명성(Lack of Transparency)이 문제의 핵심으로 지적됩니다.

검증 가능한 주장과 커뮤니티의 반응

제기된 의혹은 모델의 자체 식별 결과가중치 텐서(Weight Tensor) 분석이라는 두 가지 독립적인 방법으로 검증 가능하다고 합니다. 모델이 'Rio' 대신 'Nex'로 자신을 밝히는 비율이 높고, 맞춤형 백스토리(Bespoke Backstory)까지 그대로 언급하는 점은 의혹에 힘을 싣습니다. 커뮤니티에서는 이러한 기술적 증거(Technical Evidence)를 바탕으로 저작권 및 기여도 표기 문제(Attribution Issues)에 대한 비판적인 시각이 지배적입니다.

오픈소스 LLM 생태계의 과제

이번 사건은 오픈소스 LLM(Open-Source LLM) 모델 공개 및 활용 과정에서의 투명성(Transparency)정확한 기여도 표기(Proper Attribution)의 중요성을 다시 한번 부각시킵니다. 일부에서는 지자체 IT 부서가 이러한 시도를 했다는 점 자체에 대해 긍정적인 시각도 있지만, 결과적으로 기존 연구 성과를 부적절하게 활용했다는 비판을 피하기 어렵습니다. 향후 유사 사례 방지를 위한 가이드라인 마련이 필요하다는 의견도 나옵니다.

Rio de Janeiro's "homegrown" LLM appears to be a merge of an existing model