GLM-5.2, 오픈 웨이트 모델의 새로운 기준 제시

Z ai의 GLM-5.2가 AI 분석 지수(Intelligence Index) 51점으로 오픈 웨이트 모델 중 최고 성능을 기록함

과학적 추론 능력(Scientific Reasoning) 및 에이전트 성능(GDPval-AA v2)에서 이전 모델 대비 큰 폭의 향상을 보임

비용 대비 성능(Cost per Task) 측면에서도 경쟁 모델 대비 우수한 위치를 차지함

커뮤니티에서는 추론 효율성 및 멀티모달 기능 부재에 대한 논의가 있음

GLM-5.2의 지능 및 비용 효율성 분석

GLM-5.2는 AI 분석 지수(Intelligence Index v4.1)에서 51점을 기록하며 MiniMax-M3, DeepSeek V4 Pro 등 경쟁 모델을 앞섰습니다. 특히 GDPval-AA v2 지표에서는 1524점을 달성하여 GPT-5.5와 유사한 수준의 실제 에이전트 성능(Real-world Agentic Performance)을 보여줍니다. 또한, 작업당 비용(Cost per Task) 측면에서도 경쟁 모델 대비 낮은 비용을 유지하며 파레토 최적선(Pareto Frontier) 상에 위치하여 비용 효율성(Cost-Effectiveness)을 입증했습니다.

추론 효율성 및 토큰 사용량에 대한 커뮤니티 우려

커뮤니티에서는 GLM-5.2의 지능 향상 대비 추론 효율성(Reasoning Efficiency) 개선이 더디다는 지적이 있습니다. 한 사용자는 Nim으로 작성된 수학 평가 라이브러리 생성에 GLM-5.2가 45k 토큰을 사용하며 15분 이상 소요된 사례를 공유했습니다. 이는 GPT-5.5의 16k 토큰 대비 현저히 높은 수치로, 속도(Speed)가 중요한 사용자들에게는 단점으로 작용할 수 있다는 의견입니다.

멀티모달 기능 부재와 활용성 제한

GLM-5.2는 텍스트 입력만 지원하는 텍스트 전용 모델(Text-only Model)이라는 점이 지적되었습니다. 현재 OpenAI, Anthropic, Gemini 등 주요 모델들이 이미지 입력을 지원하는 것과 대조적입니다. 웹 디자인과 같이 이미지 이해가 필요한 작업에서 스크린샷을 통한 HTML/CSS 생성 등이 불가능하여 활용성에 제한이 있다는 의견이 있습니다. 이는 웹 UI 분석 및 생성 작업에서 큰 단점으로 작용할 수 있습니다.

오픈 웨이트 모델의 빠른 발전 속도와 경쟁 구도

커뮤니티에서는 GLM-5.2의 등장이 오픈 웨이트 모델이 클로즈드 모델과의 격차를 빠르게 좁히고 있음을 보여준다고 평가합니다. 일부 사용자는 GLM-5.2가 Opus 4.5 수준 이상의 성능을 보일 것으로 기대하며, 이는 개인 및 중소기업의 자체 하드웨어 구축을 통한 모델 운영 가능성을 시사합니다. 다만, 일부에서는 벤치마크 결과와 실제 사용 경험 간의 괴리가 존재한다는 의견도 제기되었습니다.

비용 및 접근성 측면에서의 GLM-5.2의 강점

GLM-5.2는 공식 API 가격이 저렴할 뿐만 아니라, 일부 제공업체에서는 무제한 토큰을 월 $50에 제공하는 등 매우 저렴한 비용(Low Cost)으로 접근 가능합니다. 이는 Anthropic, OpenAI 등 기존 빅테크 기업 모델 대비 상당한 가격 경쟁력을 가지며, 오픈 소스 생태계에 큰 이점을 제공한다는 평가입니다. 다만, 일부 사용자는 Zai의 API 제공업체인 Ziphu의 용량 문제(Capacity Issues)로 인해 느린 속도나 타임아웃을 경험했다고 언급했습니다.