Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima

Anthropic ha rilasciato oggi Claude Sonnet 5, il nuovo modello della famiglia Sonnet che restringe il divario con Opus 4.8, il modello di punta dell'azienda, mantenendo invariato il prezzo di listino. Sonnet 5 è costruito per essere il Sonnet più agentic mai prodotto: pianifica, usa strumenti come browser e terminale e opera in autonomia a un livello che fino a pochi mesi fa richiedeva modelli più grandi e costosi.

L'annuncio arriva il 30 giugno 2026, e il modello è già disponibile su tutti i piani: è il default per Free e Pro, ed è accessibile agli utenti Max, Team ed Enterprise. In Claude Code e sulla piattaforma Claude arriva con un prezzo introduttivo di $2 per milione di token in input e $10 per milione in output fino al 31 agosto 2026, dopo il quale passa al prezzo standard di $3/$15, identico a quello di Sonnet 4.6. L'API model ID è claude-sonnet-5.

Cosa cambia rispetto a Sonnet 4.6

La tabella dei benchmark pubblicata nell'annuncio mostra miglioramenti su tutte le metriche agentiche: ragionamento, uso degli strumenti, coding e lavoro professionale. Anthropic descrive il salto come "sostanziale" e le curve costo-performance pubblicate lo confermano: Sonnet 5 è uno strict improvement su Sonnet 4.6 sia su BrowseComp (agentic search) sia su OSWorld-Verified (computer use), e si posiziona nella stessa fascia di Opus 4.8 a costi significativamente inferiori.

Opus 4.8 costa $5/$25 per milione di token. Sonnet 5, a $3/$15, offre capacità vicine a Opus a circa il 40% in meno di costo per token. Regolando il parametro effort (low, medium, high, xhigh) si può calibrare il trade-off costo-performance in base al task.

Sonnet 5 usa un tokenizer aggiornato, simile a quello introdotto con Opus 4.7. Lo stesso input può generare da 1.0 a 1.35 volte più token rispetto al tokenizer precedente, a seconda del tipo di contenuto. Il prezzo introduttivo di $2/$10 è calibrato per rendere la transizione da Sonnet 4.6 sostanzialmente neutra in termini di costo effettivo.

Sicurezza e capability cyber

Anthropic riporta un tasso complessivamente inferiore di comportamenti indesiderati rispetto a Sonnet 4.6, specialmente in contesti agentici. La system card pubblicata insieme al modello documenta miglioramenti nella robustezza contro il prompt injection e una riduzione di allucinazioni e sycophancy.

Le capacità di cybersecurity restano sostanzialmente inferiori a quelle di Opus 4.8 e Mythos 5: nei test di exploit development su Firefox 147 (condotti in collaborazione con Mozilla, vulnerabilità già patchate in Firefox 148), Sonnet 5 non è mai riuscito a sviluppare un exploit funzionante. I cyber safeguards sono comunque attivati di default, nello stesso regime applicato a Opus 4.7 e 4.8.

Un dato curioso dalla system card: Sonnet 5 è il primo modello Anthropic a criticare la propria Costituzione, in particolare la regola che impone di seguire vincoli rigidi anche quando li considera non etici. Non è un problema di sicurezza, ma è un comportamento mai osservato prima.

Cosa dicono i partner Early Access

Dieci aziende hanno testato Sonnet 5 in anteprima, e il feedback è coerente: il modello porta a termine task complessi dove i Sonnet precedenti si fermavano a metà, verifica il proprio output senza che gli venga chiesto esplicitamente e lo fa a un prezzo competitivo.

CodeRabbit lo descrive come "un execution layer solido per lavoro multi-step di software engineering", capace di gestire debugging e uso strumenti in contesti tecnici complessi. Da Lovable il commento è che rifiuta richieste non sicure in modo pulito e consistente — "un modello che sa dire di no è importante quanto uno che sa costruire". Augment l'ha testato su decine di pull request reali complesse, portandole tutte fino a un risultato testato e verificato in autonomia. ClickHouse nota che "ragiona in passaggi più stretti e porta gli utenti alle risposte più velocemente".

Cosa tenere presente

La tabella dei benchmark nell'annuncio è in formato immagine, quindi i numeri precisi per ogni valutazione vanno verificati direttamente sulla pagina ufficiale o sulla system card. Le curve costo-performance pubblicate sono il riferimento più solido per valutare il posizionamento relativo.

Il cambio di tokenizer va considerato se si migra da Sonnet 4.6 su workload dove il conteggio token è un fattore di costo dominante. Il pricing introduttivo mitiga l'impatto, ma dopo il 31 agosto il prezzo effettivo per richiesta potrebbe aumentare leggermente per alcuni tipi di contenuto.

I rate limit sono stati aumentati su Chat, Cowork, Claude Code e Claude Platform per accomodare il maggiore consumo di token dei livelli di effort più alti.

Fonti:

Con Sonnet 5, Anthropic comprime la distanza fra il tier intermedio e la fascia flagship, senza toccare i prezzi. Per chi già usava Sonnet 4.6 via API o Claude Code, l'upgrade è immediato. Per chi invece usava Opus 4.8 per carichi di lavoro agentici, Sonnet 5 a $3/$15 pone una domanda interessante: quanto valore aggiunto portano quei punti percentuale in più di Opus, e a che costo? Lo state già provando?

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Cosa cambia rispetto a Sonnet 4.6

Sicurezza e capability cyber

Cosa dicono i partner Early Access

Cosa tenere presente

I rate limit sono stati aumentati su Chat, Cowork, Claude Code e Claude Platform per accomodare il maggiore consumo di token dei livelli di effort più alti.

Fonti: