Codex app + CLI: perché oggi è uno dei coding agent più completi

Il titolo è volutamente forte, quindi parto dal caveat: non sto dicendo che Codex sia il migliore per qualsiasi cosa. Sto dicendo che, se per "coding agent" intendiamo il senso moderno del termine — non autocomplete e non chat laterale, ma un agente che legge il repo, propone patch, esegue comandi, lavora su branch e worktree e ti lascia un diff da revisionare — oggi Codex è uno dei pacchetti più completi in circolazione.
Il modello conta: GPT-5.5
Qui il modello non è un dettaglio. GPT-5.5 dentro Codex è una parte grossa del discorso: la pagina pricing di OpenAI lo indica tra i modelli disponibili nei piani Codex e lo descrive come più efficiente di GPT-5.4 a parità di risultati. Nella pratica si sente soprattutto sui task lunghi: meno esitazione, più capacità di tenere insieme file, test, errori e iterazioni successive.
Tre superfici, un solo agente
La parte più interessante è la combinazione tra modello e superfici di utilizzo:
- La CLI è quella più vicina al lavoro reale: parte nel terminale, dentro la directory del progetto, ed è open source, Rust-based, disponibile su macOS, Windows e Linux. Git, test, build, package manager e log sono già lì: non devi descrivere tutto in chat, devi dare un task preciso e poi controllare il risultato.
- L'app desktop va vista come command center più che come editor: gestisce thread Codex in parallelo, con supporto a worktree, automazioni e funzioni Git. Utile per seguire più lavori isolati — una bugfix, una review, un'esplorazione del repo.
- Codex web/cloud porta i task in background, i repo collegati a GitHub e le PR. Qui però più automazione significa più disciplina: ambiente, permessi, accesso a internet, segreti e review finale non sono dettagli.
Un buon prompt non è "fammi l'app migliore"
Il valore non è che "scrive codice" — quello lo fanno tutti. Il valore è che si avvicina a un ciclo tecnico completo: capire, cambiare, testare, spiegare il diff. Un prompt sensato suona più o meno così:
"Guarda come sono strutturati i test di questo modulo, aggiungi quelli mancanti per il caso X, esegui la suite e mostrami solo il diff finale."
Il confronto con gli altri
- Cursor resta la scelta più naturale se vuoi restare nell'editor e ragionare file per file.
- Claude Code è fortissimo per ragionamento profondo, refactor complessi e cambi multi-file dove la coerenza conta più della velocità.
- Codex prova a coprire una porzione più larga del ciclo: GPT-5.5, terminale locale, app desktop, cloud, GitHub, sandbox, approval policy,
AGENTS.md, subagents e review. Non è il migliore in ogni singola categoria, ma come piattaforma agentica complessiva è difficile ignorarlo.
Il caveat: non è un'autorità
Se il prompt è vago, il diff si allarga. Se il repo non ha test, l'agente può sembrare convincente anche quando accumula supposizioni. OpenAI documenta sandbox e approval policy — di default il network è disabilitato e la scrittura è limitata al workspace — ma resta uno strumento che legge, modifica ed esegue comandi. Il modo corretto di usarlo è volutamente noioso, ed è proprio per questo che funziona: branch pulito, task piccolo, prompt concreto, permessi stretti, test eseguiti, diff letto davvero e merge solo dopo review umana.
Dentro quel perimetro, Codex app + CLI con GPT-5.5 è uno dei setup più potenti disponibili oggi per sviluppare con agenti. Fuori da quel perimetro, diventa facilmente un moltiplicatore di complessità. E tu quale useresti come coding agent principale — Codex, Claude Code, Cursor o altro? E preferisci lavorare da CLI, editor o cloud?
📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.


