GLM-5, 오픈소스 AI 모델로 성능과 접근성 모두 잡았다!

by DD
3개월 전
조회수 18

GLM-5는 744B 파라미터(40B active)로 확장, DeepSeek Sparse Attention(DSA)을 통합하여 배포 비용을 절감함

학술 벤치마크에서 GLM-4.7 대비 유의미한 성능 향상을 보였으며, 오픈소스 모델 중 최고 수준을 달성함

오픈소스 모델로 출시되어 Hugging Face 및 ModelScope에서 모델 가중치를 제공하며, Z.ai에서 Agent 모드 지원

커뮤니티에서는 성능에 대한 기대와 함께 중국 AI 기술 발전에 대한 긍정적 평가가 이어짐

GLM-5의 기술적 특징 및 성능 향상

GLM-5는 GLM-4.7 대비 모델 크기 확장(355B → 744B)과 훈련 데이터 증가(23T → 28.5T tokens)를 통해 성능을 개선했다. 특히, DeepSeek Sparse Attention(DSA)을 통합하여 배포 비용 절감(Deployment Cost Reduction)과 장기 컨텍스트 처리 능력을 유지했다. 벤치마크 결과, 추론, 코딩, 에이전트 작업 등에서 오픈소스 모델 중 최고 성능을 기록하며, 상용 모델과의 격차를 좁혔다.

오픈소스 모델로서의 접근성과 생태계

GLM-5는 Hugging Face 및 ModelScope에서 모델 가중치를 공개하여 오픈소스 생태계(Open Source Ecosystem)에 기여한다. 또한, Z.ai 플랫폼에서 Agent 모드를 지원하여 사용자들이 문서 생성, 멀티턴 협업 등 다양한 기능을 활용할 수 있도록 했다. 이러한 접근성은 개발자들이 모델을 자유롭게 사용하고, 맞춤형 솔루션(Custom Solutions)을 개발하는 데 기여할 것으로 예상된다.

커뮤니티의 평가 및 실제 사용 경험

커뮤니티에서는 GLM-5의 성능에 대한 기대와 함께, 실제 사용 경험에 대한 다양한 의견이 제시되었다. 일부 사용자는 GLM-4.7 대비 개선된 성능(Improved Performance)을 체감했다고 언급했으며, 특히 긴 작업 처리 능력과 안정성에 긍정적인 평가를 내렸다. 반면, 일부 사용자는 지침 준수(Instruction Following) 측면에서 개선의 여지가 있다고 평가했다.

중국 AI 기술 발전과 미국과의 경쟁 구도

이번 GLM-5 출시를 통해 중국 AI 기술의 발전이 가속화되고 있다는 평가가 나온다. 특히, Huawei Ascend 칩을 활용하여 모델을 훈련했다는 점은 주목할 만하다. 이는 미국 제재에도 불구하고 중국이 자체적인 AI 기술 역량을 강화하고 있음을 시사한다. 이러한 기술 발전은 향후 AI 분야에서 경쟁 구도(Competitive Landscape)에 큰 영향을 미칠 것으로 예상된다.

GLM-5: Targeting complex systems engineering and long-horizon agentic tasks