Command Code: il coding agent che impara il tuo stile e porta i modelli open source al livello dei frontier

Chi lavora con modelli open source per il coding lo sa bene: la qualità dell'output non dipende solo dal modello, ma dall'harness che lo avvolge. Un buon framework fa la differenza tra un agente che funziona davvero nel lavoro quotidiano e uno che si inceppa alla prima tool call complessa. **Command Code** è un coding agent da terminale che prova esattamente a colmare questo gap.
Il problema che vuole risolvere
Modelli come DeepSeek V4 Pro, Kimi, GLM, Qwen e MiniMax M3 sono ormai competitivi sui benchmark di coding. Nel workflow reale — tool call, contesto lungo, refactor multi-file — spesso rendono però meno dei modelli frontier closed. Il motivo, secondo Command Code, non è il modello in sé, ma l'agent harness non ottimizzato per loro.
Il framework gestisce:
- routing delle richieste e cache;
- gestione del contesto (finestre fino a 1M token);
- riparazione automatica delle tool call fallite (tool-call repair);
- modalità di esecuzione diverse: interattiva, plan, headless.
Il claim interno più significativo è che DeepSeek V4 Pro, dentro il loro harness, avrebbe superato Opus 4.7 in 6 test su 10 di valutazione con uso intensivo di tool. È un risultato first-party, senza benchmark indipendenti a confermarlo: va preso come indicazione di direzione, non come verdetto definitivo.
Taste: la feature che distingue Command Code
La parte più interessante dal punto di vista del prodotto è taste-1, il sistema di apprendimento dello stile. In pratica:
- ogni volta che accetti, rifiuti o modifichi una suggestion dell'agente, quel segnale viene usato per adattare il comportamento futuro;
- i pattern ricorrenti diventano skills riutilizzabili automaticamente;
- le skills sono portabili tra membri del team via CLI (
npx taste push/npx taste pull); - è disponibile anche una memory personale per progetto.
L'idea non è nuovissima — anche Cursor e altri strumenti hanno forme di rules e memory — ma l'approccio di Command Code è più strutturato: il taste è trattato come un oggetto versionabile e condivisibile, non come un semplice file di regole scritto a mano.
Installazione e funzionalità operative
L'installazione segue il pattern standard per tool Node:
```bash
npm i -g command-code
cd your-project && cmd
```
Dopo l'init si sceglie il modello e si inizia a lavorare nella codebase. Le funzionalità operative includono:
- slash commands per le azioni comuni;
- plan mode (pianifica prima di eseguire);
- headless mode (per automazione e scripting);
- checkpoint per tornare a stati precedenti;
- review di PR integrata;
- supporto MCP per connettere tool esterni;
- integrazione IDE.
Pricing e moltiplicatori sui modelli open source
Il piano Go parte da $1/mese e include $10 di crediti mensili. I moltiplicatori applicati ai modelli open source trasformano quei $10 in:
- ~$40 di utilizzo su DeepSeek V4 Pro (moltiplicatore 4×, permanente);
- ~$20 su Qwen 3.7 Max (2×, fino al 22 giugno 2026);
- ~$20 su MiniMax M3 (2× su contesto ≤512K, permanente);
- ~$23 su Nemotron 3 Ultra (fino a 2.3×, permanente);
- ~$50 su MiMo V2.5 (5×, permanente).
I piani superiori — Pro $15, Max $100, Ultra $200 — scalano i crediti e sbloccano anche i frontier model closed (Claude Opus 4.8, GPT-5.5). I crediti extra sono acquistabili al costo API senza markup, e quelli non usati non scadono.
Supporta anche BYOK: puoi portare le tue chiavi Anthropic, OpenAI, Bedrock o Vertex senza markup sul routing.
Privacy
Il team dichiara che il codice resta sulla macchina dell'utente, che non viene usato per training, e che taste e memory rimangono locali. Vale la pena leggere la privacy policy completa prima di usarlo su codice sensibile.
Per chi ha senso provarlo
Se già usate Claude Code, Codex CLI, OpenCode o strumenti simili e vi siete chiesti quanto rendono bene i modelli open source in un agent harness serio, Command Code è un esperimento interessante. Con $1 di ingresso e crediti che valgono 4× su DeepSeek V4 Pro, il costo per provarlo è basso e il confronto con il setup attuale è fattibile in un pomeriggio.
Per chi cerca invece un sostituto definitivo di Claude Code in produzione critica, il consiglio è di aspettare review indipendenti e testare su codebase reali prima di migrare.
Fonti
L'idea di un taste condivisibile tra membri del team vi sembra una svolta concreta per il lavoro collaborativo, o è ancora troppo astratta per la pratica quotidiana?
📌 Questo articolo riassume una discussione su r/vibecodingitalia. Leggi il post originale.


