Andrej Karpathy sul vibe coding: osservazioni reali dopo settimane con Claude

Il 26 gennaio 2026 Andrej Karpathy ha pubblicato su X una serie di osservazioni sul suo workflow di coding con agenti AI dopo settimane di uso intenso di Claude. Non è hype da influencer tech: è la testimonianza diretta di uno degli ingegneri più rispettati del settore, che descrive un cambiamento concreto e misurabile nel suo modo di lavorare. Vale la pena leggerlo con attenzione.

Il cambio di fase nel workflow

Karpathy descrive una transizione rapida e quasi sorprendente: da circa 80% programmazione manuale + autocomplete e 20% agenti a novembre, a 80% coding con agenti e 20% modifiche manuali a dicembre. Un mese.

La sua sintesi è diretta: sta programmando principalmente in inglese, descrivendo a parole il codice che vuole. Lo chiama quasi con imbarazzo, ma aggiunge che la capacità di operare sul software tramite grandi "azioni sul codice" è semplicemente troppo utile per ignorarla. Lo definisce il cambiamento più grande nel suo workflow di programmazione in circa due decenni, avvenuto in poche settimane.

IDE, sciami di agenti e fallibilità

Karpathy smonta due hype in circolazione: quello del "non serve più un IDE" e quello degli "sciami di agenti autonomi". Secondo lui, al momento sono entrambi esagerati.

I modelli commettono ancora errori, ma di tipo diverso rispetto al passato: non più semplici errori di sintassi, bensì errori concettuali sottili, del tipo che farebbe uno sviluppatore junior frettoloso. La categoria più frequente è quella delle assunzioni non verificate: il modello assume qualcosa al posto tuo e procede senza controllare. Altri problemi ricorrenti:

non gestiscono bene la propria confusione e raramente chiedono chiarimenti;
non evidenziano incoerenze né presentano trade-off;
sono troppo compiacenti, non fanno resistenza quando dovrebbero;
tendono a gonfiare il codice: astrazioni inutili, codice morto lasciato indietro, costruzioni che potrebbero essere 100 righe e invece ne occupano 1.000;
a volte modificano o rimuovono commenti e codice che non capiscono, anche quando è separato dal task richiesto.

Tutto questo nonostante istruzioni esplicite nel file CLAUDE.md. Il suo setup attuale: Claude Code in alcune finestre di Ghostty a sinistra, un IDE a destra per visualizzare il codice e fare modifiche manuali.

Tenacia: il vantaggio che non ci si aspetta

Uno degli aspetti più interessanti che Karpathy descrive è la tenacia degli agenti. Un agente non si stanca, non si demoralizza, continua a provare approcci diversi molto oltre il punto in cui un essere umano avrebbe rimandato il problema. Lo descrive come uno di quei momenti in cui "senti l'AGI": guardi l'agente lottare con qualcosa per mezz'ora, poi uscirne vincitore. Conclude che la resistenza — intesa come persistenza nel tentativo — è uno dei colli di bottiglia fondamentali del lavoro, e che gli LLM l'hanno drasticamente ampliata.

Accelerazione o espansione?

Misurare lo "speedup" garantito dagli LLM è complicato. Karpathy si sente più veloce nelle cose che avrebbe comunque fatto, ma l'effetto principale è un altro: fa molte più cose di quante ne avrebbe fatte. Due ragioni specifiche:

può sviluppare cose che prima non sarebbero valse la pena di codificare;
può avvicinarsi a codice su cui non sarebbe riuscito a lavorare per limiti di conoscenza o competenza.

La sua conclusione: più che un'accelerazione, è un'espansione.

Come usare bene la leva degli agenti

Karpathy offre alcune indicazioni pratiche su come sfruttare al meglio gli agenti:

non dire loro cosa fare: dagli criteri di successo e osserva;
falli scrivere prima i test, poi falli passare;
mettili in loop con un browser MCP;
scrivi prima l'algoritmo ingenuo, probabilmente corretto, poi chiedigli di ottimizzarlo preservando la correttezza;
passa da un approccio imperativo a uno dichiarativo: gli agenti iterano più a lungo e tu ottieni più leva.

Il lato inaspettato: è più divertente

Karpathy ammette di non aspettarsi che programmare con gli agenti risultasse più divertente. Il lavoro ripetitivo di "riempimento dei vuoti" sparisce, resta la parte creativa. C'è meno blocco, più coraggio nell'affrontare problemi.

Allo stesso tempo, nota che il coding con LLM dividerà gli ingegneri tra chi amava principalmente scrivere codice e chi amava principalmente costruire cose.

Atrofia e slopocalisse

Due avvertimenti importanti. Il primo: Karpathy ha già notato di star atrofizzando la capacità di scrivere codice manualmente. Generazione e discriminazione del codice sono capacità diverse, e la prima si indebolisce quando non la si esercita.

Il secondo: si aspetta il 2026 come l'anno della slopocalisse — una valanga di contenuti generati da AI su GitHub, Substack, arXiv, X e social in generale, insieme a molto teatro della produttività legato all'hype dell'AI.

Le domande aperte

Karpathy chiude con alcune domande che restano senza risposta:

Cosa succede al "10X engineer"? Il divario di produttività tra l'ingegnere medio e quello massimo potrebbe crescere parecchio.
I generalisti supereranno gli specialisti? Gli LLM sono molto più bravi nel micro che nel macro.
Come sarà programmare con gli LLM in futuro? Come giocare a StarCraft? A Factorio? Come suonare musica?
Quanta parte della società è limitata dal lavoro digitale basato sulla conoscenza?

Il suo TL;DR finale: le capacità degli agenti LLM — in particolare Claude e Codex — hanno superato una soglia di coerenza intorno a dicembre 2025 e hanno prodotto un cambio di fase nell'ingegneria del software. L'intelligenza sembra improvvisamente molto avanti rispetto a tutto il resto: integrazioni, strumenti, conoscenza, workflow organizzativi, processi. Il 2026 sarà un anno ad alta energia mentre l'industria metabolizzerà questa nuova capacità.

Tu stai già notando qualcosa di simile nel tuo workflow? Il tuo equilibrio tra coding manuale e agenti sta cambiando, e in che direzione?

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Il cambio di fase nel workflow

IDE, sciami di agenti e fallibilità

Karpathy smonta due hype in circolazione: quello del "non serve più un IDE" e quello degli "sciami di agenti autonomi". Secondo lui, al momento sono entrambi esagerati.

non gestiscono bene la propria confusione e raramente chiedono chiarimenti;
non evidenziano incoerenze né presentano trade-off;
sono troppo compiacenti, non fanno resistenza quando dovrebbero;
tendono a gonfiare il codice: astrazioni inutili, codice morto lasciato indietro, costruzioni che potrebbero essere 100 righe e invece ne occupano 1.000;
a volte modificano o rimuovono commenti e codice che non capiscono, anche quando è separato dal task richiesto.

Tenacia: il vantaggio che non ci si aspetta

Accelerazione o espansione?

può sviluppare cose che prima non sarebbero valse la pena di codificare;
può avvicinarsi a codice su cui non sarebbe riuscito a lavorare per limiti di conoscenza o competenza.

La sua conclusione: più che un'accelerazione, è un'espansione.

Come usare bene la leva degli agenti

Karpathy offre alcune indicazioni pratiche su come sfruttare al meglio gli agenti:

non dire loro cosa fare: dagli criteri di successo e osserva;
falli scrivere prima i test, poi falli passare;
mettili in loop con un browser MCP;
scrivi prima l'algoritmo ingenuo, probabilmente corretto, poi chiedigli di ottimizzarlo preservando la correttezza;
passa da un approccio imperativo a uno dichiarativo: gli agenti iterano più a lungo e tu ottieni più leva.

Il lato inaspettato: è più divertente

Allo stesso tempo, nota che il coding con LLM dividerà gli ingegneri tra chi amava principalmente scrivere codice e chi amava principalmente costruire cose.

Atrofia e slopocalisse

Le domande aperte

Karpathy chiude con alcune domande che restano senza risposta:

Cosa succede al "10X engineer"? Il divario di produttività tra l'ingegnere medio e quello massimo potrebbe crescere parecchio.
I generalisti supereranno gli specialisti? Gli LLM sono molto più bravi nel micro che nel macro.
Come sarà programmare con gli LLM in futuro? Come giocare a StarCraft? A Factorio? Come suonare musica?
Quanta parte della società è limitata dal lavoro digitale basato sulla conoscenza?

Tu stai già notando qualcosa di simile nel tuo workflow? Il tuo equilibrio tra coding manuale e agenti sta cambiando, e in che direzione?

📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.

Andrej Karpathy sul vibe coding: osservazioni reali dopo settimane con Claude

Il cambio di fase nel workflow

IDE, sciami di agenti e fallibilità

Tenacia: il vantaggio che non ci si aspetta

Accelerazione o espansione?

Come usare bene la leva degli agenti

Il lato inaspettato: è più divertente

Atrofia e slopocalisse

Le domande aperte

Michael Gasperini@TheStreamCode

Sonnet 5 + Fable 5 Advisor: uno dei sistemi più efficaci mai introdotti in una coding CLI

Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima

Claude Opus 5 è disponibile: vicino a Fable 5, metà del prezzo

Andrej Karpathy sul vibe coding: osservazioni reali dopo settimane con Claude

Il cambio di fase nel workflow

IDE, sciami di agenti e fallibilità

Tenacia: il vantaggio che non ci si aspetta

Accelerazione o espansione?

Come usare bene la leva degli agenti

Il lato inaspettato: è più divertente

Atrofia e slopocalisse

Le domande aperte

Michael Gasperini@TheStreamCode

Sonnet 5 + Fable 5 Advisor: uno dei sistemi più efficaci mai introdotti in una coding CLI

Claude Sonnet 5: Anthropic avvicina il tier Sonnet a Opus 4.8, stesso prezzo di prima

Claude Opus 5 è disponibile: vicino a Fable 5, metà del prezzo