LongCat-2.0: Meituan rilascia il MoE da 1.6 trilioni sotto licenza MIT, già #1 su OpenRouter come Owl Alpha

Meituan ha rilasciato oggi LongCat-2.0, modello MoE da 1.6 trilioni di parametri con circa 48 miliardi attivati per token e contesto nativo da 1 milione di token. La novità più rilevante per chi sviluppa: pesi open source sotto licenza MIT (in caricamento su Hugging Face) e API commerciale già operativa con prezzi aggressivi. Veniva già usato in produzione, ma sotto altro nome. LongCat-2.0 si celava dietro "Owl Alpha", il modello anonimo che ha guidato le classifiche globali di OpenRouter per due mesi, processando circa 10.1 trilioni di token al mese con una crescita del 242% rispetto al mese precedente. Al momento della rivelazione occupava il primo posto tra i modelli su Hermes Agent, il secondo su Claude Code e il terzo su OpenClaw. Il dettaglio è riportato da VentureBeat.
Architettura e contesto da 1M
LongCat-2.0 eredita la famiglia LongCat-Flash introducendo LongCat Sparse Attention (LSA), un'evoluzione di DeepSeek Sparse Attention che Meituan descrive come il superamento del collo di bottiglia del Lightning Indexer. LSA combina tre ottimizzazioni applicabili in modo indipendente: Streaming-aware Indexing trasforma accessi frammentati in letture sequenziali allineate all'hardware, Cross-Layer Indexing riusa un singolo passaggio di indicizzazione su strati adiacenti via distillazione cross-layer, e Hierarchical Indexing applica scoring a due stadi (coarse recall e fine selection) per ridurre lo spazio dei candidati. Un modulo N-gram Embedding da 135 miliardi di parametri espande lo spazio di embedding di circa 100 volte rispetto alla base, catturando contesto locale più denso senza appesantire gli expert del MoE. La soglia di attivazione dinamica va da 33B a 56B parametri per token. Il pretraining copre oltre 35 trilioni di token su più di 50.000 ASIC, senza rollback o spike di loss irreversibili. Il dato infrastrutturale è significativo: si tratta del primo modello da un trilione di parametri addestrato interamente su hardware cinese, non su GPU Nvidia. DeepSeek-V4 aveva usato chip cinesi solo per l'inferenza, non per il pretraining completo.
Post-training: MOPD e tre gruppi di expert
Sul lato post-training, Meituan introduce MOPD (Multi-Teacher On-Policy Distill), un'architettura che fonde tre gruppi di expert specializzati: Agent Expert per l'esecuzione autonoma di task, tool invocation e self-correction, Reasoning Expert per matematica, STEM e multi-hop reasoning, Interaction Expert per allineamento, riduzione delle allucinazioni e safety. Il gate routing MOPD instrada le richieste ai cluster specializzati. L'integrazione con coding agent è nativa: Claude Code, OpenClaw e Hermes sono supportati direttamente, e i benchmark coding sono condotti all'interno di questi harness.
I numeri
I benchmark pubblicati sono misurati in-house da Meituan sotto harness unificato, tranne quelli marcati con asterisco (metriche esterne riportate). Nei coding agentic LongCat-2.0 ottiene 70.8 su Terminal-Bench 2.1, 59.5 su SWE-bench Pro e 77.3 su SWE-bench Multilingual. Su SWE-bench Pro batte GPT-5.5 (58.6) e Gemini 3.1 Pro (54.2), ma resta sotto Opus 4.8 (69.2). Su FORTE (73.2) supera Gemini 3.1 Pro (70.3) e pareggia Opus 4.6 (73.2), mentre GPT-5.5 (77.8) e Opus 4.7 (77.6) restano sopra. Su IMO-AnswerBench (81.8) pareggia Opus 4.7 e batte GPT-5.5 (79.5), ma Gemini 3.1 Pro arriva a 90.0. Sui punteggi fondamentali il divario cresce: IFEval a 90.0 contro 96.1 di Gemini 3.1 Pro e 95.0 di GPT-5.5, GPQA-diamond a 88.9 contro 94.3 e 93.6*. Meituan ha costruito il modello per il coding agentico, non per inseguire ogni benchmark generale.
Prezzi e disponibilità
L'API commerciale su LongCat Platform usa un modello di pricing particolare: i context-cache hit sono gratis, i cache miss seguono pay-as-you-go a $0.75/M token in input e $2.95/M in output. Una promozione limitata abbassa i prezzi a $0.30/$1.20 per milione, in linea con MiniMax-M3 ($0.30/$1.20) e sotto GLM-5.2 ($1.40/$4.40) o Kimi K2.6 ($0.95/$4.00). I pesi open source sono annunciati come "coming soon" su Hugging Face con licenza MIT, ma al momento della pubblicazione non sono ancora scaricabili. Il repository GitHub contiene README e figure ma nessun file di pesi. L'API e la piattaforma chat sono operative via longcat.chat.
Cosa tenere presente
I benchmark in-house vanno letti come posizionamento del vendor, non come valutazione indipendente. I punteggi marcati con asterisco provengono dai report dei rispettivi vendor. I benchmark coding più rilevanti (SWE-bench, Terminal-Bench) sono valutati dentro harness standard come Claude Code, il che riduce il rischio di setup bias rispetto a valutazioni bare-model. La disponibilità dei pesi resta il fattore critico per il self-hosting. Un MoE da 1.6T richiede hardware significativo: anche con attivazione sparsa a 48B, i pesi completi occupano molta VRAM. L'API è accessibile, ma il self-hosting dipende dal completamento del caricamento su Hugging Face. Meituan è un'azienda cinese. Per chi lavora con codice di clienti europei, il transito dei dati via API LongCat Platform richiede verifica sulle sedi di elaborazione, come già visto per Z.ai, DeepSeek e gli altri provider cinesi. Fonti:
- Introducing LongCat-2.0, blog ufficiale
- GitHub, meituan-longcat/LongCat-2.0
- Hugging Face, LongCat-2.0 (licenza MIT)
- VentureBeat, Meituan open sources LongCat-2.0
- SCMP, Meituan debuts China's biggest AI model trained on local chips Con 1M di contesto, integrazione nativa con i principali coding agent e licenza MIT, LongCat-2.0 si posiziona come uno dei modelli open più ambiziosi del momento. I pesi non sono ancora disponibili, ma l'API è già operativa. Lo vedete come alternativa concreta a GLM-5.2 o DeepSeek per il coding agentico, o aspettate pesi e valutazioni indipendenti prima di pronunciarvi?
📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Scritto da
Michael Gasperini@TheStreamCode
Founder & Sviluppatore
Founder di Vibecoding Italia, la community italiana sull'intelligenza artificiale. Progetta e sviluppa prodotti con l'AI e ne racconta l'applicazione pratica attraverso guide e articoli.

