중국 Z.ai, 개방형 GLM-5.2 모델로 GPT-5.5 제치고 1/6 비용으로 코딩 벤치마크 선도
핵심 지표
- 모델 크기: 7,530억 파라미터 (전 세계 최대 규모 개방형 LLM 중 하나)
- 컨텍스트 창: 100만 토큰 (일반 모델의 10배 이상)
- 비용 효율성: GPT-5.5 대비 1/6 비용 ($5.80 vs $35.00 per 100만 토큰)
- 벤치마크 성능: SWE-bench Pro에서 GPT-5.5(58.6)보다 높은 62.1점
결론
Z.ai가 출시한 GLM-5.2는 개방형 모델로서 프론티어급 성능을 제공하면서도 주요 경쟁사 모델의 1/6 수준의 비용으로 운영될 수 있습니다. MIT 라이선스로 완전히 오픈소스화되어 기업들이 자체 인프라에서 프론티어급 AI를 호스팅하고 맞춤화할 수 있는 중요한 대안이 될 것입니다.
사실
Z.ai(구 지푸 AI)는 '장기 지향적' 자율 코딩 및 엔지니어링 작업을 특화한 7,530억 파라미터 개방형 대형 언어 모델 GLM-5.2를 발표했습니다. 이 모델은 Hugging Face, Z.ai API 및 20개 이상의 제3자 코딩 환경에서 즉시 사용 가능하며, 100만 토큰 컨텍스트 창을 지원합니다. 기업 구독 요금은 월 $12.60부터 시작됩니다.
GLM-5.2의 핵심 아키텍처 혁신은 'IndexShare'로, 표준 거대 언어 모델에서 장문 문서에 대한 어텐션 메커니즘 재계산은 계산적으로 매우 비쌉니다. IndexShare는 동일한 인덱서를 네 개의 희소 어텐션 레이어마다 재사용하여 최대 100만 토큰 컨텍스트 길이에서 토큰당 계산 FLOPs를 2.9배나 줄입니다.
모델은 또한 추론 중 수락된 토큰 길이를 최대 20%까지 증가시키는 업그레이드된 다중 토큰 예측(MTP) 레이어를 특징으로 합니다. 사용자는 'Max'와 'High' 사이에서 모델의 추론 노력 수준을 전환할 수 있습니다.
벤치마크 성능 비교
GLM-5.2는 업계 표준 제3자 벤치마크 테스트에서 대부분의 오픈소스 플래그십 모델을 능가하며, 폐쇄형 가중치 경쟁 모델인 OpenAI의 GPT-5.5와 Anthropic의 Claude Opus 4.8에 근접하거나 일부 범주에서는 앞서나갑니다.
| 벤치마크 | GLM-5.2 | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro | 62.1 | 58.6 | - |
| FrontierSWE (Dominance) | 74.4% | 72.6% | 75.1% |
| MCP-Atlas | 77.0 | 75.3 | 77.8 |
| Terminal-Bench 2.1 | 81.0 | 84.0 | 85.0 |
| Design Arena (ELO) | 1360 (1위) | - | - |
특히 장기 지향적 소프트웨어 엔지니어링 작업에서 GLM-5.2는 두각을 나타냅니다. SWE-bench Pro에서 62.1점으로 GPT-5.5(58.6)를 크게 앞섰으며, FrontierSWE(Dominance)에서는 74.4%로 GPT-5.5(72.6%)를 능가했습니다. 또한 MCP-Atlas 도구 사용 평가에서 77.0점으로 GPT-5.5(75.3)를 앞섰습니다.
해석
개발자 관점에서 GLM-5.2의 등장은 AI 모델 산업의 중요한 전환점입니다. 이 모델은 MIT 라이선스로 완전히 오픈소스화되어 기업들이 제약 없이 다운로드, 맞춤화, 상업화할 수 있게 합니다. 이는 지리적 제한이나 상업적 제한 없이 프론티어급 AI를 자체 인프라에서 호스팅할 수 있는 중요한 경로를 제공합니다.
"선택 가능한 사고 모드"는 실제 애플리케이션에서 중요한 최적화 레버를 제공합니다. 'Max' 수준에서는 최고의 지능을 발휘하지만 작업당 출력 토큰이 약 85,000개에 달하는 반면, 'High' 설정에서는 성능이 약간 저하되지만 필요한 출력 토큰을 절반으로 줄여 지연 시간에 민감한 애플리케이션에 필수적입니다.
가격 경쟁력
Z.ai의 GLM-5.2 API 가격은 $1.40/100만 입력 토큰, $4.40/100만 출력 토큰으로, 글로벌 중간 가격대 모델입니다. 하지만 주요 경쟁사에 비해 훨씬 저렴합니다.
| 모델 | 입력 (100만 토큰당) | 출력 (100만 토큰당) | 총합 |
|---|---|---|---|
| GLM-5.2 | $1.40 | $4.40 | $5.80 |
| GPT-5.5 | $5.00 | $30.00 | $35.00 |
| Claude Opus 4.8 | $5.00 | $25.00 | $30.00 |
| Claude Fable 5 | $10.00 | $50.00 | $60.00 |
장기 컨텍스트 워크로드에 대한 비용을 추가로 최적화하기 위해 Z.ai는 $0.26/100만 토큰의 캐시된 입력 비율을 제공합니다.
전망 및 리스크
GLM-5.2의 출시는 개방형 모델 혁신과 서구 독점 연구소 간의 대조를 명확히 보여줍니다. 개발자 커뮤니티에서는 "프론티어 연구소들이 API 가격으로 완전히 속이고 있다"는 지적이 나오고 있습니다. 7,440억 파라미터 GLM-5.2가 $4.40/100만 출력 토큰을 청구하는 반면, 독점 모델들은 훨씬 높은 프리미엄을 요구하고 있습니다.
GLM-5.2의 개발자 반응은 즉각적이고 압도적으로 긍정적입니다. Kilo Code, Cline IDE, Eigent AI 등 주요 개발 도구들은 출시 첫날부터 통합을 발표했으며, 특히 경제적 이점을 강조했습니다.
관전 포인트는 GLM-5.2가 실제로 독점 모델을 대체할 수 있는지에 대한 장기적인 성능 지속성입니다. 현재로서는 특정 벤치마크에서 우수하지만, 일반적인 사용 사례에서의 일관된 성능은 여전히 검증이 필요합니다. 또한 MIT 라이선스의 완전한 개방성이 장기적으로 어떤 혁신을 촉발할지 주목할 필요가 있습니다.
제휴없음.