OpenRouter Fusion: multi-modello in parallelo a metà prezzo

OpenRouter ha lanciato Fusion, una API che invece di chiamare un modello solo ne chiama diversi in parallelo, fa sintetizzare i risultati da un "giudice" e restituisce una risposta unica. Il claim è ambizioso: intelligenza comparabile a Claude Fable 5 a circa metà del costo.

Come funziona

Il prompt dell'utente viene inviato simultaneamente a un panel di modelli (fino a 8), ciascuno con web search e web fetch attivi. Un modello giudice riceve tutte le risposte e produce un'analisi strutturata in cinque dimensioni: punti di consenso, contraddizioni, copertura parziale, insight unici e punti ciechi. La risposta finale viene scritta a partire da quell'analisi.

Dal lato client è una singola chiamata API: basta usare lo slug openrouter/fusion, come faresti con qualsiasi altro modello.

I due preset

OpenRouter fornisce due configurazioni pronte (panel e giudice restano comunque personalizzabili):

Quality: Claude Opus, GPT, Gemini Pro — i modelli frontier.
Budget: Gemini 3 Flash, Kimi K2.6, DeepSeek V4 Pro.

I numeri del benchmark

OpenRouter ha testato Fusion su DRACO, un benchmark di deep research creato da Perplexity AI: 100 task in 10 domini (medicina, legge, finanza, tech, ecc.), con circa 39 criteri per task tra accuratezza fattuale, profondità, qualità della presentazione e citazioni. I risultati principali (punteggio normalizzato 0–100):

Fable 5 da solo: 65,3%
Budget panel (Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro): 64,7% — a 0,6 punti da Fable, a circa metà del costo secondo OpenRouter
Panel frontier (Fable 5 + GPT-5.5): 69,0% — supera qualsiasi modello singolo nel test

Il dettaglio sul prezzo

Fusion non ha un costo fisso: si paga la somma di tutte le completions sottostanti (ogni modello del panel più il giudice). Il "metà prezzo" è riferito al confronto tra budget panel e Fable 5 da solo, non è un prezzo assoluto.

Per prompt tattici e veloci (completamento codice, refactor mirati) è probabilmente overkill; per task di ricerca, analisi comparativa o domande dove sbagliare costa caro, il trade-off può avere senso.

Cose da tenere presenti

I benchmark DRACO sono test interni di OpenRouter, non una valutazione indipendente. Il paper DRACO stesso nota che i punteggi assoluti possono variare di 10–25 punti in base al modello usato come giudice. Inoltre Fable 5 ha bloccato 7 task su 100 per filtri sui contenuti: i punteggi che lo coinvolgono riflettono 93 task, gli altri modelli tutti e 100.

Qualche link utile:

Per chi usa coding agent

Fusion è uno slug come un altro: se il tuo tool accetta endpoint OpenAI-compatible, puoi chiamarlo al posto del modello singolo. Non è pensato per scrivere codice, ma per task di ricerca, analisi e decisioni architetturali.

Lo vedi utile nel tuo workflow, o resta una cosa da benchmark che nella pratica non useresti?

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Tag:AI LLM Claude Gemini ChatGPT

Scritto da

Michael Gasperini@TheStreamCode

Founder & Sviluppatore

Founder di Vibe Coding Italia, la community italiana sull'intelligenza artificiale. Progetta e sviluppa prodotti con l'AI e ne racconta l'applicazione pratica attraverso guide e articoli.

Novità

Claude Opus 5 è disponibile: vicino a Fable 5, metà del prezzo

24 luglio 2026

Anthropic rilascia Claude Opus 5: benchmark vicini a Fable 5 a $5/$25 per milione di token. Nuovo default su Max, Fast mode 2.5x, model ID claude-opus-5.

Leggi articolo

Claude Code Advisor — Sonnet 5 + Fable 5

Novità

Sonnet 5 + Fable 5 Advisor: uno dei sistemi più efficaci mai introdotti in una coding CLI

18 luglio 2026

L'Advisor di Claude Code unisce Sonnet 5 come executor e Fable 5 come consulente: costi ridotti, qualità quasi pari a Fable puro e come replicarlo.

Leggi articolo

Novità

Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima

30 giugno 2026

Claude Sonnet 5 è disponibile su tutti i piani: nuovo tokenizer, cyber safeguards e performance vicine a Opus 4.8. Prezzo introduttivo $2/$10.

Leggi articolo

OpenRouter lancia Fusion: multi-modello in parallelo che compete con Fable a metà prezzo

Come funziona

I due preset

I numeri del benchmark

Il dettaglio sul prezzo

Cose da tenere presenti

Per chi usa coding agent

Michael Gasperini@TheStreamCode

Claude Opus 5 è disponibile: vicino a Fable 5, metà del prezzo

Sonnet 5 + Fable 5 Advisor: uno dei sistemi più efficaci mai introdotti in una coding CLI

Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima

OpenRouter lancia Fusion: multi-modello in parallelo che compete con Fable a metà prezzo

Come funziona

I due preset

I numeri del benchmark

Il dettaglio sul prezzo

Cose da tenere presenti

Per chi usa coding agent

Michael Gasperini@TheStreamCode

Claude Opus 5 è disponibile: vicino a Fable 5, metà del prezzo

Sonnet 5 + Fable 5 Advisor: uno dei sistemi più efficaci mai introdotti in una coding CLI

Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima