GLM-5.2: Z.ai lancia il nuovo flagship con 1M di contesto e open source MIT in arrivo

Z.ai ha annunciato GLM-5.2, il nuovo modello flagship della famiglia GLM. È già disponibile per tutti gli utenti del GLM Coding Plan — Lite, Pro, Max e Team — e sarà rilasciato come open source la prossima settimana sotto licenza MIT.
Cosa cambia rispetto a GLM-5.1
GLM-5.1 era uscito ad aprile. In poco più di un mese, GLM-5.2 porta alcune novità concrete:
Contesto fino a 1 milione di token. GLM-5.1 si fermava a 200K: qui si sale di un fattore 5x. Per refactor su codebase estese, sessioni agentiche prolungate e task che richiedono di mantenere molto contesto attivo, è un salto significativo.
Due livelli di thinking effort: High e Max. Per il coding, Z.ai raccomanda il livello Max, che attiva un ragionamento più approfondito. In Claude Code, gli effort medium e high mappano su High, mentre xhigh, max e ultracode attivano Max.
Continuità sulla linea "long-horizon". Già introdotta con GLM-5.1, Z.ai afferma che il modello mantiene stabilità e coerenza su task che richiedono centinaia di iterazioni e migliaia di chiamate agli strumenti. Va detto che al momento non esistono benchmark indipendenti a supporto di questi numeri.
Disponibilità e rollout
Il rollout per tutti gli utenti Coding Plan è partito oggi — Z.ai ha confermato l'inizio del rilascio circa tre ore dopo l'annuncio ufficiale. API, chatbot e pesi open source su Hugging Face arriveranno la prossima settimana.
Come usarlo con Claude Code
Per configurare GLM-5.2 come modello predefinito in Claude Code, basta modificare ~/.claude/settings.json:
```json
{
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
}
}
```
Il livello di thinking si seleziona poi con il comando /effort. GLM-5.2 è supportato anche su OpenClaw, Cline, Kilo Code, Roo Code e altri tool compatibili.
Cosa tenere presente prima di adottarlo
Alcuni aspetti pratici da non ignorare:
- Pesi e API non ancora pubblici. L'annuncio dice "next week": per ora GLM-5.2 è accessibile esclusivamente tramite Coding Plan.
- Moltiplicatori di consumo orario. I piani Z.ai applicano 3x in fascia peak e 2x in fascia off-peak (ridotto a 1x fino a fine giugno in promozione). Il costo effettivo per sessione varia a seconda dell'orario di utilizzo.
- Origine dei dati. Z.ai è un'azienda cinese (Zhipu AI). Chi lavora con codice di clienti europei dovrebbe verificare dove transitano i dati: la documentazione attuale non è esplicita su questo punto.
L'open source di Z.ai nel contesto più ampio
Nonostante le considerazioni sopra, l'impegno open source di Z.ai rimane uno dei più consistenti nel panorama dei modelli di coding: GLM-5, GLM-5.1 e ora GLM-5.2 sono tutti sotto licenza MIT, con pesi scaricabili e compatibilità nativa con Claude Code e OpenClaw. Non è un dettaglio trascurabile, soprattutto per chi vuole ospitare i modelli in locale o su infrastruttura propria.
Link utili
Voi avete già un Coding Plan Z.ai o usate GLM tramite API o provider? Con 1M di contesto e l'open source MIT in arrivo, lo vedete come alternativa concreta a Claude o GPT per il coding agentico?
📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.


