Codex app + CLI: perché oggi è uno dei coding agent più completi

Il titolo è volutamente forte, quindi parto dal caveat: non sto dicendo che Codex sia il migliore per qualsiasi cosa. Sto dicendo che, se per "coding agent" intendiamo il senso moderno del termine — non autocomplete e non chat laterale, ma un agente che legge il repo, propone patch, esegue comandi, lavora su branch e worktree e ti lascia un diff da revisionare — oggi Codex è uno dei pacchetti più completi in circolazione.

Il modello conta: GPT-5.5

Qui il modello non è un dettaglio. GPT-5.5 dentro Codex è una parte grossa del discorso: la pagina pricing di OpenAI lo indica tra i modelli disponibili nei piani Codex e lo descrive come più efficiente di GPT-5.4 a parità di risultati. Nella pratica si sente soprattutto sui task lunghi: meno esitazione, più capacità di tenere insieme file, test, errori e iterazioni successive.

Tre superfici, un solo agente

La parte più interessante è la combinazione tra modello e superfici di utilizzo:

La CLI è quella più vicina al lavoro reale: parte nel terminale, dentro la directory del progetto, ed è open source, Rust-based, disponibile su macOS, Windows e Linux. Git, test, build, package manager e log sono già lì: non devi descrivere tutto in chat, devi dare un task preciso e poi controllare il risultato.
L'app desktop va vista come command center più che come editor: gestisce thread Codex in parallelo, con supporto a worktree, automazioni e funzioni Git. Utile per seguire più lavori isolati — una bugfix, una review, un'esplorazione del repo.
Codex web/cloud porta i task in background, i repo collegati a GitHub e le PR. Qui però più automazione significa più disciplina: ambiente, permessi, accesso a internet, segreti e review finale non sono dettagli.

Un buon prompt non è "fammi l'app migliore"

Il valore non è che "scrive codice" — quello lo fanno tutti. Il valore è che si avvicina a un ciclo tecnico completo: capire, cambiare, testare, spiegare il diff. Un prompt sensato suona più o meno così:

"Guarda come sono strutturati i test di questo modulo, aggiungi quelli mancanti per il caso X, esegui la suite e mostrami solo il diff finale."

Il confronto con gli altri

Cursor resta la scelta più naturale se vuoi restare nell'editor e ragionare file per file.
Claude Code è fortissimo per ragionamento profondo, refactor complessi e cambi multi-file dove la coerenza conta più della velocità.
Codex prova a coprire una porzione più larga del ciclo: GPT-5.5, terminale locale, app desktop, cloud, GitHub, sandbox, approval policy, AGENTS.md, subagents e review. Non è il migliore in ogni singola categoria, ma come piattaforma agentica complessiva è difficile ignorarlo.

Il caveat: non è un'autorità

Se il prompt è vago, il diff si allarga. Se il repo non ha test, l'agente può sembrare convincente anche quando accumula supposizioni. OpenAI documenta sandbox e approval policy — di default il network è disabilitato e la scrittura è limitata al workspace — ma resta uno strumento che legge, modifica ed esegue comandi. Il modo corretto di usarlo è volutamente noioso, ed è proprio per questo che funziona: branch pulito, task piccolo, prompt concreto, permessi stretti, test eseguiti, diff letto davvero e merge solo dopo review umana.

Dentro quel perimetro, Codex app + CLI con GPT-5.5 è uno dei setup più potenti disponibili oggi per sviluppare con agenti. Fuori da quel perimetro, diventa facilmente un moltiplicatore di complessità. E tu quale useresti come coding agent principale — Codex, Claude Code, Cursor o altro? E preferisci lavorare da CLI, editor o cloud?

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Il modello conta: GPT-5.5

Tre superfici, un solo agente

La parte più interessante è la combinazione tra modello e superfici di utilizzo:

La CLI è quella più vicina al lavoro reale: parte nel terminale, dentro la directory del progetto, ed è open source, Rust-based, disponibile su macOS, Windows e Linux. Git, test, build, package manager e log sono già lì: non devi descrivere tutto in chat, devi dare un task preciso e poi controllare il risultato.

L'app desktop va vista come command center più che come editor: gestisce thread Codex in parallelo, con supporto a worktree, automazioni e funzioni Git. Utile per seguire più lavori isolati — una bugfix, una review, un'esplorazione del repo.

Codex web/cloud porta i task in background, i repo collegati a GitHub e le PR. Qui però più automazione significa più disciplina: ambiente, permessi, accesso a internet, segreti e review finale non sono dettagli.

Un buon prompt non è "fammi l'app migliore"

"Guarda come sono strutturati i test di questo modulo, aggiungi quelli mancanti per il caso X, esegui la suite e mostrami solo il diff finale."

Il confronto con gli altri

Cursor resta la scelta più naturale se vuoi restare nell'editor e ragionare file per file.

Claude Code è fortissimo per ragionamento profondo, refactor complessi e cambi multi-file dove la coerenza conta più della velocità.

Codex prova a coprire una porzione più larga del ciclo: GPT-5.5, terminale locale, app desktop, cloud, GitHub, sandbox, approval policy, AGENTS.md, subagents e review. Non è il migliore in ogni singola categoria, ma come piattaforma agentica complessiva è difficile ignorarlo.

Il caveat: non è un'autorità

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Codex app + CLI: perché oggi è uno dei coding agent più completi

Il modello conta: GPT-5.5

Tre superfici, un solo agente

Un buon prompt non è "fammi l'app migliore"

Il confronto con gli altri

Il caveat: non è un'autorità

Michael Gasperini@TheStreamCode

Roomote: l'agente cloud self-hostable dei creatori di Roo Code è su GitHub

T3 Code: un'interfaccia open source per Codex, Claude Code, Cursor e OpenCode

Qoder alza il tetto: dentro Cantus e Qwen3.8-Max

Codex app + CLI: perché oggi è uno dei coding agent più completi

Il modello conta: GPT-5.5

Tre superfici, un solo agente

Un buon prompt non è "fammi l'app migliore"

Il confronto con gli altri

Il caveat: non è un'autorità

Michael Gasperini@TheStreamCode

Roomote: l'agente cloud self-hostable dei creatori di Roo Code è su GitHub

T3 Code: un'interfaccia open source per Codex, Claude Code, Cursor e OpenCode

Qoder alza il tetto: dentro Cantus e Qwen3.8-Max