Codex non è solo per i modelli OpenAI: funziona con open source, Ollama, LM Studio e provider compatibili

Tibo (il lead di Codex in OpenAI) ha twittato un promemoria utile: «Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models.»
È una cosa che in parte si sapeva, ma vedere il lead del progetto ribadirlo pubblicamente dà un segnale chiaro: Codex come harness per coding agent non è legato a doppio filo ai modelli OpenAI. Se hai già un setup con modelli locali o provider OpenAI-compatibili, puoi agganciarci Codex.
Le due strade: OSS mode e provider personalizzati
1. OSS mode (modelli locali)
Codex ha un flag --oss che lo fa funzionare direttamente con provider locali come Ollama o LM Studio. Basta impostare il provider di default nel config:
```toml
~/.codex/config.toml
oss_provider = "ollama" # o "lmstudio"
```
E si lancia con:
```bash
codex --oss "aggiungi i test per questo modulo"
```
Il modello usato è quello che hai in esecuzione locale. Niente API key, niente chiamate esterne.
2. Provider personalizzati (qualsiasi endpoint OpenAI-compatibile)
Se invece usi un provider cloud OpenAI-compatibile (tipo OpenRouter, Groq o un proxy locale), puoi definirlo come provider custom:
```toml
~/.codex/config.toml
model_provider = "openrouter"
[model_providers.openrouter]
name = "OpenRouter"
base_url = "https://openrouter.ai/api/v1"
env_key = "OPENROUTER_API_KEY"
```
Codex tratta l'endpoint come un normale provider OpenAI-compatibile. Puoi anche definire più provider e switchare con --profile.
Cosa significa in pratica
- Niente lock-in sul modello: se OpenAI rilascia un modello più costoso o meno adatto al tuo task, puoi usare un modello open source self-hosted o un provider terzo senza cambiare tool.
- Privacy e dati locali: con OSS mode tutto gira in locale, i dati non escono dalla tua macchina.
- Costi: i modelli locali sono gratis (a parte la GPU), i provider alternativi possono costare meno delle API OpenAI.
- Sperimentazione: puoi testare modelli nuovi (DeepSeek, Qwen, Llama, Mistral) dentro lo stesso ambiente di sviluppo che usi ogni giorno.
I limiti (da tenere presenti)
I modelli open source locali, per quanto stiano migliorando, non sono ancora al livello di GPT-5.5 su task di coding complessi — soprattutto refactoring profondi, debug multi-file e comprensione di codebase grandi. Con OSS mode e modelli locali nella fascia 7-14B, Codex funziona ma va tarato nelle aspettative: meglio per task contenuti, prototipazione, script.
Inoltre il flag --oss e la configurazione dei provider custom richiedono un minimo di dimestichezza con TOML e variabili d'ambiente. Niente di drammatico, ma non è plug-and-play come l'esperienza ChatGPT/Codex con un account Plus.
Infine, Codex con provider non-OpenAI entra in territorio meno battuto: alcune feature (tipo il reasoning effort o il sandbox avanzato) sono pensate per l'API OpenAI e potrebbero non tradursi 1:1 su provider terzi. La documentazione ufficiale lo chiarisce in più punti.
Fonti
Tu usi già Codex con modelli locali o provider alternativi? Che setup hai e come ti trovi rispetto ai modelli OpenAI?
📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Scritto da
Michael Gasperini@TheStreamCode
Founder & Sviluppatore
Founder di Vibecoding Italia, la community italiana sull'intelligenza artificiale. Progetta e sviluppa prodotti con l'AI e ne racconta l'applicazione pratica attraverso guide e articoli.

