- Claude Opus 4.7 offre notevoli vantaggi nell'ingegneria del software avanzata, nella visione multimodale, nella gestione della memoria e nell'elaborazione della conoscenza, mantenendo al contempo la finestra di contesto di 1 milione di token e i prezzi attuali.
- Questa versione perfeziona il comportamento con un'esecuzione più letterale delle istruzioni, un nuovo tokenizzatore, parametri di campionamento più rigorosi e un approccio adattivo, richiedendo aggiornamenti immediati e delle API durante la migrazione da Opus 4.6.
- Nuove funzionalità di controllo come i livelli di impegno, i budget per le attività, un utilizzo ottimizzato della memoria del file system e le misure di sicurezza informatica rendono Opus 4.7 più adatto a flussi di lavoro complessi e agenti autonomi più sicuri.
- La modalità automatica, i riepiloghi, la modalità focus e la regolazione dell'impegno di Claude Code, combinati con la sistematica autoverifica del lavoro, consentono di ottenere notevoli aumenti di produttività su progetti di programmazione complessi e reali.
Claude Opus 4.7 viene rilasciato come nuovo modello di punta di Anthropic, disponibile a livello generale, e per gli sviluppatori non si tratta tanto di un piccolo aggiornamento, quanto piuttosto di una nuova generazione di strumenti. L'obiettivo di questa release è chiaro: attività di ingegneria del software più complesse, flussi di lavoro autonomi più lunghi, una comprensione multimodale più approfondita e un controllo più rigoroso su quanto il modello "pensa" e spende. Se avete spinto al limite le precedenti versioni di Opus con agenti di codifica complessi, lavori basati sulla conoscenza e sui dati o automazione basata sulla visione artificiale, questo aggiornamento cambia le carte in tavola in diversi modi pratici.
Ciò che spicca davvero è che Anthropic non ha solo aumentato la capacità pura; ha anche rielaborato i comportamenti chiave, API e guardrail Pertanto, Opus 4.7 si comporta più come un compagno di squadra affidabile che può essere lasciato in esecuzione per lavori di lunga durata. L'esecuzione delle istruzioni è più rigorosa, la memoria è più utilizzabile nei progetti reali, il supporto multimodale raggiunge una vera alta risoluzione e la piattaforma circostante (Claude Code, budget delle attività, livelli di impegno) è stata ottimizzata per i flussi di lavoro reali degli sviluppatori. Ciò significa che dovrete rivedere alcuni prompt e l'infrastruttura, ma se vi adatterete, potrete delegare una parte maggiore delle "cose difficili e noiose" rispetto a prima.
Ciò che Claude Opus 4.7 si propone di essere per gli sviluppatori
Anthropic posiziona Claude Opus 4.7 come il suo modello più performante attualmente disponibile, ottimizzato specificamente per attività "agenti" a lungo termine e compiti che richiedono conoscenze avanzate. In parole semplici, è progettato per eseguire flussi di lavoro software e dati a più fasi con meno interventi manuali, migliori autodiagnosi e un comportamento più coerente nel tempo.
Rispetto a Opus 4.6, il nuovo modello mostra notevoli miglioramenti nell'ingegneria del software avanzata, soprattutto negli incarichi più complessi che in precedenza richiedevano una stretta supervisione umana. I primi utenti riferiscono di poter ora affidare i loro problemi di programmazione più complessi, tra cui refactoring profondamente annidati, modifiche multi-servizio e debug intricati, a Opus 4.7 con molta più fiducia. Il modello non si limita a generare codice; pianifica, esegue e riverifica il proprio lavoro in modo molto più rigoroso.
A livello tecnico, Opus 4.7 conserva la stessa finestra di contesto da 1 milione di token e fino a 128 token di output che rendevano le versioni precedenti di Opus attraenti per codebase e documenti di grandi dimensioni. Supporta inoltre il pensiero adattivo, lo strumento e la piattaforma già noti di Opus 4.6, ed è disponibile ovunque ci si aspetti: tramite l'API di Claude, tutti i prodotti Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry. Il prezzo rimane invariato: circa 5 dollari per milione di token di input e 25 dollari per milione di token di output.
Al di là dei limiti di throughput e di token, il modello è volutamente più autonomo nel modo in cui gestisce i cicli "simili ad agenti". Grazie a nuovi concetti come i budget di attività e il parametro di impegno perfezionato, Opus 4.7 è pensato per essere integrato in sistemi in cui può orchestrare più fasi (utilizzo di strumenti, modifiche di file, verifiche, riepiloghi) senza dover continuamente restituire il controllo all'utente.
Cambiamenti comportamentali e di esecuzione delle istruzioni più marcati a cui gli sviluppatori devono adattarsi
Una delle differenze più evidenti che gli sviluppatori noteranno quotidianamente è la precisione con cui Opus 4.7 segue le istruzioni rispetto ai modelli Claude precedenti. Mentre Opus 4.6 e versioni simili a volte tralasciavano i dettagli, generalizzavano da un esempio all'altro o saltavano silenziosamente le parti meno chiare di una richiesta, Opus 4.7 si sforza molto di attenersi esattamente a ciò che hai scritto, e poco altro.
Questa maggiore aderenza alle istruzioni ha una conseguenza pratica: i suggerimenti che prima funzionavano "abbastanza bene" ora possono iniziare a comportarsi in modi sorprendenti. Se i vostri vecchi sistemi di integrazione si basavano sul modello per dedurre passaggi che non avevate esplicitato completamente, o per generalizzare schemi da un elemento dell'elenco all'altro, potreste ora riscontrare un output che appare rigido o incompleto. Per questo motivo, Anthropic raccomanda esplicitamente di rivedere e ricalibrare i prompt e i sistemi di integrazione.
Anche la lunghezza delle risposte è calibrata in modo diverso: Opus 4.7 adatta la verbosità alla complessità percepita del compito, anziché utilizzare di default uno stile di risposta a lunghezza fissa. Per domande semplici, si ottengono spesso risposte più concise, mentre attività più complesse, composte da più parti o che richiedono l'intervento di un agente, producono naturalmente output più lunghi e dettagliati. Questa dinamica di dimensionamento implica che, se l'applicazione ha vincoli di output stringenti, è opportuno essere più espliciti in merito alla brevità.
Il modello, inoltre, utilizza di default un minor numero di chiamate a strumenti e si affida maggiormente al proprio ragionamento, a meno che non lo si incoraggi deliberatamente a utilizzare strumenti aumentando il livello di impegno. Questa è una buona notizia per la latenza e i costi in molti casi, ma se il tuo sistema prevede un'architettura che fa ampio uso di strumenti (ad esempio, esecuzione aggressiva del codice, linter o simulatori), dovresti verificare se è necessario incentivare un maggiore utilizzo di strumenti tramite richieste e ottimizzazione dello sforzo richiesto.
Dal punto di vista del tono, Opus 4.7 si allontana dallo stile eccessivamente caloroso e ricco di conferme di Opus 4.6 per adottare una voce più diretta e decisa, con meno emoji e meno frasi di circostanza del tipo "stai andando alla grande". Per gli strumenti di sviluppo, questo è solitamente un vantaggio: si ottengono giudizi più chiari, critiche più dirette e meno edulcorazioni. Per le app per utenti finali che si basano su un linguaggio particolarmente amichevole, potrebbe essere opportuno specificare esplicitamente il tono nei messaggi.
Visione ad alta risoluzione e vantaggi multimodali che contano nei progetti reali
Opus 4.7 è il primo modello Claude con un autentico supporto per immagini ad alta risoluzione, che porta la dimensione massima dell'immagine a 2576 pixel sul lato lungo, ovvero circa 3.75 megapixel. Si tratta di un valore più che triplo rispetto al limite precedente di 1568 pixel / 1.15 MP, e cambia radicalmente ciò che è possibile fornire in sicurezza al modello quando si ha a che fare con artefatti visivi densi.
Questo incremento di risoluzione si traduce direttamente in prestazioni migliori per i carichi di lavoro che richiedono un'elevata elaborazione visiva: gli agenti possono ora analizzare in modo affidabile screenshot di interfacce utente complesse, diagrammi elaborati e scansioni di documenti contenenti dettagli minuziosi. Casi d'uso come agenti informatici che leggono screenshot completi del desktop, estraggono dati strutturati da grafici complessi o confrontano layout precisi al pixel diventano molto più fattibili senza dover ridimensionare tutto al punto da perdere informazioni.
Anthropic ha inoltre semplificato la gestione delle coordinate, in modo che le coordinate interne del modello corrispondano in modo univoco ai pixel effettivi dell'immagine. Questo significa che quando si mappano riquadri di delimitazione, aree di clic o annotazioni sovrapposte, non è necessario gestire manualmente i fattori di scala. È molto più semplice dire "clicca in (x, y)" basandosi sull'output del modello e fidandosi del fatto che corrisponda esattamente all'immagine inviata.
Oltre alla pura risoluzione, Opus 4.7 migliora la percezione e la localizzazione di basso livello: è più efficace nel puntare, misurare, contare e svolgere attività simili che richiedono precisione, e il rilevamento dei riquadri di delimitazione delle immagini naturali è più accurato. Per gli sviluppatori che creano agenti per il test dell'interfaccia utente, pipeline di controllo qualità visiva o bot per l'analisi dei grafici, questi piccoli accorgimenti si traducono in un minor numero di errori nel calcolo delle coordinate e nel rilevamento degli oggetti.
Naturalmente, c'è un compromesso: le immagini ad alta risoluzione consumano più token. Se non si ha effettivamente bisogno di una fedeltà superiore, Anthropic suggerisce di ridurre la risoluzione delle immagini prima di inviarle al modello per tenere sotto controllo l'utilizzo dei token. Ma quando è necessario ogni singolo pixel, ad esempio per trascrivere i dati di un grafico a livello di pixel o per verificare il layout delle diapositive fino alle singole etichette, i nuovi limiti rappresentano un chiaro vantaggio.
Flusso di lavoro basato sulla conoscenza, sulla finanza e sui documenti professionali
Opus 4.7 non è solo un aggiornamento del codice; ottiene anche punteggi migliori nei benchmark per il lavoro basato sulla conoscenza, soprattutto in settori come la finanza e il diritto, dove la precisione e il ragionamento tra documenti sono fondamentali. Nella valutazione interna di Anthropic Finance Agent, Opus 4.7 raggiunge prestazioni all'avanguardia e si comporta più come un abile analista junior che come un semplice generatore di testo.
Nei test interni, il modello ha prodotto modelli e analisi finanziarie più rigorosi rispetto a Opus 4.6, con narrazioni meglio strutturate e presupposti più chiari. Inoltre, è riuscito a integrare meglio diverse sotto-attività, come la raccolta dati, la modellazione numerica e la creazione di presentazioni, in risultati finali coerenti e dall'aspetto professionale.
Opus 4.7 raggiunge inoltre risultati all'avanguardia su GDPval-AA, un benchmark di terze parti incentrato sul lavoro basato sulla conoscenza economicamente rilevante nei settori della finanza, del diritto e in ambiti correlati. Ciò suggerisce che non si tratta solo di successi interni selezionati ad hoc: il modello supera sistematicamente il suo predecessore in problemi complessi di ragionamento applicato, dove sono in gioco soldi o rischi reali.
Per quanto riguarda la gestione dei documenti, Opus 4.7 si dimostra nettamente superiore nei flussi di lavoro che prevedono la generazione e la successiva verifica visiva di file Office come .docx e .pptx. È migliorato nella generazione di modifiche tracciate nei file Word, nella regolazione dei layout in PowerPoint e nella successiva rilettura di tali risultati, tramite strumenti o visione artificiale, per garantire la correttezza del design e della formattazione delle diapositive. Se in precedenza le istruzioni dovevano spiegare in modo eccessivamente dettagliato "ricontrolla il layout della diapositiva prima di restituirla", ora potresti essere in grado di semplificare ulteriormente il processo.
Anche i grafici e l'analisi delle figure beneficiano delle nuove funzionalità multimodali. Opus 4.7 è più efficace nell'inviare strumenti esterni, come le librerie di elaborazione delle immagini Python (ad esempio, PIL), per ispezionare i grafici, estrarre dati a livello di pixel e tradurre tali visualizzazioni in set di dati strutturati o spiegazioni. Questa combinazione – l'utilizzo di strumenti esterni e una visione più precisa – lo rende molto più utilizzabile come partner in dashboard di analisi e pipeline di reporting.
Memoria, agenti a lungo termine e scratchpad del file system
Un altro ambito in cui Opus 4.7 apporta miglioramenti, seppur in modo discreto ma sostanziale, è la gestione della memoria, soprattutto nelle configurazioni in cui l'agente può scrivere e leggere da un file di note persistente o da un archivio strutturato. Invece di trattare ogni richiesta come un inizio perlopiù nuovo, il modello è più bravo a decidere quali dettagli annotare, come etichettarli e quando riutilizzarli nei turni futuri. Inoltre, migliora la tolleranza ai falli nella ricerca distribuita su flussi lunghi che dipendono dal contesto persistente.
Se il vostro agente tiene un blocco note, un documento con appunti o un database di memoria leggero tra un turno e l'altro, Opus 4.7 dovrebbe mostrare un netto miglioramento nella sua capacità di sfruttare tale contesto esterno. Permetterà di ricordare in modo più coerente le decisioni importanti del progetto, i risultati parziali e le attività da svolgere durante le sessioni di lavoro più lunghe, riducendo la necessità di ripetere le stesse informazioni a ogni richiesta.
Anthropic sottolinea esplicitamente che Claude ora è più abile nella scrittura e nell'utilizzo della memoria basata su file system, il che è particolarmente utile nella programmazione complessa o nella ricerca di agenti. Ad esempio, se si dispone di un bot di refactoring autonomo che tiene traccia dei problemi aperti, delle decisioni architetturali e dei test in sospeso all'interno di un insieme di file, Opus 4.7 in genere organizza e consulta tali informazioni in modo più accurato rispetto a Opus 4.6.
Se non si desidera creare un proprio livello di memoria, Anthropic offre uno strumento di gestione della memoria lato client che funge da blocco note gestito per Claude. Questo permette di sperimentare con agenti di durata maggiore, che si estendono su sessioni, rami o persino settimane di lavoro, senza dover prima creare un database vettoriale completo o un servizio di note personalizzato.
Per le tracce agentiche a lungo termine, il modello tende anche a fornire all'utente aggiornamenti più regolari sui progressi compiuti. Ciò significa che se in precedenza avevi aggiunto complessi prompt di supporto solo per forzare messaggi periodici di "stato", puoi provare a semplificare e lasciare che il comportamento predefinito di Opus 4.7 gestisca la segnalazione dei progressi, in particolare a livelli di impegno più elevati in Claude Code.
Misure di sicurezza, allineamento e protezione informatica
Sul fronte della sicurezza e dell'allineamento, le valutazioni di Anthropic mostrano che Opus 4.7 ha un profilo di rischio sostanzialmente simile a Opus 4.6, con bassi tassi di comportamenti che preoccuperebbero la maggior parte degli sviluppatori: inganno, adulazione e cooperazione con l'uso improprio. Sotto diversi aspetti, è effettivamente un po' più sicuro.
Il modello ottiene punteggi migliori in termini di onestà e resistenza agli attacchi di iniezione di prompt dannosi, aspetto particolarmente rilevante se si stanno creando agenti che acquisiscono contenuti non attendibili dal web, dalle e-mail o da documenti generati dagli utenti. Una maggiore resistenza all'iniezione rende più difficile per gli input avversari di dirottare le istruzioni del modello o esfiltrare segreti tramite astuti stratagemmi di prompt.
Vi sono tuttavia alcuni aspetti in cui l'Opus 4.7 risulta leggermente inferiore all'Opus 4.6, ad esempio la tendenza a fornire consigli eccessivamente dettagliati sulla riduzione del danno in relazione alle sostanze controllate. Anthropic conclude comunque che il modello è "in gran parte ben allineato e affidabile, sebbene non del tutto ideale", e osserva che il modello più sperimentale Claude Mythos Preview rimane, secondo le loro misurazioni interne, il modello meglio allineato.
Con questa release, Anthropic inizia anche a implementare misure di sicurezza informatica in tempo reale in un modello standard, sulla base delle ricerche e dei messaggi emersi dal progetto Glasswing. Opus 4.7 include sistemi che rilevano e bloccano automaticamente le richieste legate ad argomenti di sicurezza informatica proibiti o ad alto rischio, soprattutto quando l'intento appare sospetto.
È importante sottolineare che Anthropic distingue tra uso improprio e attività di sicurezza legittime: se sei un professionista della sicurezza che si occupa di ricerca di vulnerabilità, penetration testing o red teaming, ti invitiamo a candidarti al loro Programma di Verifica Cibernetica. Questo programma ha lo scopo di fornire a professionisti qualificati l'accesso alle funzionalità di Opus 4.7 rilevanti per la sicurezza informatica, senza tuttavia aprire la porta ad abusi generalizzati, e le lezioni apprese in questo contesto guideranno le future decisioni relative al rilascio più ampio dei modelli della classe Mythos.
Nuovi strumenti di controllo per gli sviluppatori: livelli di impegno, pensiero adattivo e budget per le attività.
Opus 4.7 introduce una serie di "manopole" più articolate che consentono agli sviluppatori di bilanciare funzionalità, velocità e costi, con il parametro dell'impegno al centro. Lo sforzo determina quanto il modello riflette prima di rispondere e con quanta aggressività utilizza gli strumenti, il che influisce direttamente sulla latenza e sul consumo di token.
La novità principale è un nuovo livello di sforzo extra-elevato, xhigh, che si colloca tra alto e massimo ed è ora l'impostazione predefinita per Claude Code in tutti i piani. Per i casi d'uso di programmazione e agenti, Anthropic consiglia di iniziare con high o xhigh, riservando max solo ai problemi più complessi. Un livello di impegno maggiore si traduce in una ricerca più ampia, un ragionamento più approfondito e, in generale, una maggiore affidabilità, ma anche in un maggior numero di token di output e tempi di esecuzione più lunghi.
Opus 4.7 elimina completamente il vecchio concetto di "budget di riflessione esteso". Se provi a impostare thinking: {"type": "enabled", "budget_tokens": N}, ora riceverai un errore 400. Il pensiero adattivo è l'unica modalità "thinking-on" supportata e i benchmark interni di Anthropic dimostrano che offre prestazioni costantemente superiori rispetto ai vecchi budget estesi.
Il pensiero adattivo è disattivato per impostazione predefinita, quindi le richieste senza un campo di pensiero vengono eseguite senza un canale di ragionamento interno esplicito. Se la tua applicazione trae vantaggio da flussi di pensiero più ricchi, ad esempio una pianificazione complessa o attività di programmazione a più fasi, dovresti impostare esplicitamente thinking: {type: “adaptive”} per attivarlo.
Un'altra importante novità è rappresentata dai budget per le attività, attualmente in fase beta pubblica sulla piattaforma Claude. Un budget di attività fornisce al modello un obiettivo approssimativo su quanti token utilizzare nell'intero ciclo dell'agente: il suo ragionamento interno, le chiamate agli strumenti, i risultati degli strumenti e la risposta finale. Il modello vede un conto alla rovescia in corso e dovrebbe dare priorità al lavoro e terminare in modo controllato man mano che si avvicina al budget, invece di continuare a funzionare fino a quando max_tokens non lo interrompe bruscamente.
I budget per le attività sono indicativi, non vincolanti, e sono concettualmente distinti dal valore massimo di token (max_tokens). `max_tokens` rappresenta un limite massimo rigoroso per richiesta sui token generati ed è invisibile al modello, mentre `task_budget` è un limite flessibile, consapevole del modello, applicato all'intero ciclo. Utilizza `task_budget` quando desideri che il modello auto-modula le proprie ambizioni in base a un budget prestabilito e mantieni `max_tokens` come limite di sicurezza per evitare costi eccessivi.
Dovrai sperimentare con i budget delle attività per ogni carico di lavoro: impostandoli troppo bassi, il modello potrebbe interrompersi prematuramente o produrre risultati superficiali; impostandoli alti, pagherai di più in token. Anthropic suggerisce di non utilizzare i budget di attività per compiti aperti e non vincolati, in cui la qualità è fondamentale; è preferibile riservarli a lavori in cui è effettivamente necessario definire limiti massimi deterministici per il consumo di risorse.
Modifiche alle API e al tokenizer che influiscono sulla migrazione da Opus 4.6
Sebbene Opus 4.7 rappresenti un aggiornamento diretto da Opus 4.6, esistono diverse modifiche a livello di API e differenze di tokenizzazione di cui è assolutamente necessario tener conto nella pianificazione. Ignorare questi aspetti può portare a fuorvianti errori 400 o a picchi di costo inattesi.
Innanzitutto, Opus 4.7 utilizza un nuovo tokenizzatore che contribuisce a migliorare le prestazioni in tutte le attività, ma modifica anche il numero di token consumati dagli input e dagli output. In pratica, lo stesso testo potrebbe utilizzare da 1.0 a 1.35 volte più token rispetto a Opus 4.6, fino al 35% in più a seconda del tipo di contenuto. L'endpoint /v1/messages/count_tokens riporterà quindi valori diversi per Opus 4.7 rispetto ai modelli precedenti.
L'efficienza dei token varia a seconda della tipologia di carico di lavoro, ma i benchmark interni di Anthropic suggeriscono che l'utilizzo netto dei token può effettivamente migliorare se si considerano ragionamenti più intelligenti e una pianificazione più precisa. Detto questo, raccomandano esplicitamente di effettuare le misurazioni sul traffico di produzione reale e di aggiornare i parametri max_tokens per avere un margine di sicurezza aggiuntivo, anche per eventuali trigger di compattazione automatica che potreste aver impostato.
In secondo luogo, Anthropic ha rafforzato il controllo sui parametri di campionamento: a partire da Opus 4.7, impostare temperature, top_p o top_k su valori diversi da quelli predefiniti genererà un errore 400. Il percorso di migrazione consigliato è semplicemente quello di eliminare quei parametri dalle richieste e affidarsi al prompting per guidare lo stile e il determinismo del modello. E anche se in precedenza si utilizzava temperature = 0 per tentare di "congelare" le risposte, si tenga presente che il vero determinismo non è mai stato garantito.
In terzo luogo, in Opus 4.7 il contenuto relativo al ragionamento viene omesso di default dalle risposte. Continuerai a ricevere i blocchi di ragionamento nelle risposte in streaming, ma il relativo campo di ragionamento sarà vuoto a meno che tu non lo attivi esplicitamente. Questa modifica silenziosa migliora leggermente la latenza e riduce la larghezza di banda. Se la tua applicazione necessita di riepiloghi leggibili del ragionamento interno del modello, puoi riattivarli impostando la visualizzazione su "summarized" per l'output di ragionamento con una semplice modifica di configurazione.
Infine, alcune modifiche comportamentali che non comportano interruzioni rigide delle API potrebbero comunque richiedere aggiornamenti immediati. Questi includono un'esecuzione più letterale delle istruzioni (specialmente a livelli di sforzo inferiori), un minor numero di subagenti automatici, un minor numero di chiamate di strumenti predefiniti e il cambiamento agli aggiornamenti di avanzamento durante lunghe tracce agentiche. Anthropic fornisce un guida alla migrazione e persino un assistente di migrazione automatizzato tramite la skill Claude API per le codebase che utilizzano Claude Code o l'Agent SDK.
Claude Code con Opus 4.7: aggiornamenti pratici per il tuo flusso di lavoro di sviluppo
Claude Code, l'ambiente di programmazione di Anthropic, è stato ottimizzato in gran parte per Opus 4.7 e Boris Cherny, uno dei suoi creatori, ha condiviso consigli pratici maturati in settimane di utilizzo su progetti reali. In breve: se siete disposti a modificare il vostro metodo di lavoro, potete ottenere un notevole incremento di produttività in attività ingegneristiche complesse.
Innanzitutto, la nuova modalità automatica elimina in gran parte le continue finestre di dialogo di richiesta autorizzazione che in precedenza interrompevano i processi di lunga durata. Anziché chiederti di confermare ogni modifica o comando, Claude instrada questi controlli di autorizzazione attraverso un classificatore che approva automaticamente le azioni sicure. Puoi lasciare che Opus 4.7 si occupi di un refactoring, esegua test o pulisca i file mentre ti concentri su altro, per poi tornare a controllare i risultati.
La modalità automatica è attualmente disponibile per gli utenti Max, Teams ed Enterprise e può essere attivata/disattivata rapidamente tramite Maiusc+Tab nella riga di comando, oppure tramite il menu a tendina nell'applicazione desktop e nell'estensione di VS Code. Un vantaggio spesso sottovalutato è la possibilità di eseguire più agenti in parallelo, ognuno impegnato in un'attività specifica, e di passare da uno all'altro a seconda dei progressi, senza dover monitorare ogni singola finestra di dialogo di approvazione.
Se non ti senti a tuo agio con l'automazione completa, Claude Code offre la skill /fewer-permission-prompts che analizza la cronologia della sessione per trovare comandi ripetitivi e sicuri che comunque attivano richieste di autorizzazione. Dopo l'analisi, il sistema suggerisce i comandi che è possibile inserire nella whitelist in tutta sicurezza, eliminando così molte interruzioni di scarso valore e mantenendo al contempo le azioni a rischio più elevato soggette ad approvazione.
I riepiloghi sono un'altra funzionalità che si sposa perfettamente con l'approccio a lungo termine di Opus 4.7. Quando si riprende una sessione in esecuzione da un po' di tempo, Claude fornisce un breve riepilogo di ciò che è stato fatto e di ciò che resta da fare. Questo è particolarmente utile quando ci si allontana da un'attività di refactoring o di ricerca in corso; invece di scorrere una montagna di log o differenze, si ottiene un rapido riepilogo della situazione attuale.
Per coloro che già si affidano al modello per compiti complessi, la modalità focus nasconde le informazioni intermedie e mostra solo i risultati finali. Cherny menziona di usarlo quando non ha bisogno di monitorare ogni singolo passaggio di Opus, ma desidera solo il codice finale, i test o la documentazione. È possibile attivare o disattivare la messa a fuoco con il comando /focus direttamente nella riga di comando, il che aiuta a ridurre il rumore cognitivo durante le sessioni di lavoro che richiedono concentrazione.
Anche nel Codice Claude il controllo dello sforzo è fondamentale: Opus 4.7 abbandona i vecchi budget di ragionamento fissi e si affida interamente allo sforzo adattivo. È possibile regolare lo sforzo tramite il comando /effort, e tutti i livelli, tranne quello massimo, vengono mantenuti tra una sessione e l'altra. La strategia personale di Cherny è quella di utilizzare uno sforzo molto elevato per la maggior parte del tempo, riservando il massimo assoluto ai problemi più complessi in cui ogni ulteriore ragionamento conta.
Probabilmente il consiglio più importante che Cherny possa dare è quello di fornire sempre a Claude un modo per verificare il proprio lavoro. Indipendentemente dallo stack tecnologico, l'agente necessita di un meccanismo per eseguire test o flussi end-to-end. Nei progetti backend, ciò potrebbe significare uno script o un comando per avviare il server ed eseguire test di integrazione; nel lavoro frontend, spesso utilizza l'estensione Chromium in modo che Claude possa controllare un browser, mentre la funzionalità "Utilizzo del computer" copre le applicazioni desktop.
Il flusso di lavoro di Cherny racchiude questa filosofia in una skill /go personalizzata che permette a Claude di eseguire i test, semplificare il codice con /simplify e infine aprire una pull request. Secondo la sua esperienza, questo tipo di pipeline di verifica e successiva distribuzione raddoppia o triplica facilmente il valore ottenuto da Opus 4.7. Si allinea perfettamente con la maggiore capacità del modello di convalidare i propri output prima di inviarli.
Perché il principio "prima il duro lavoro, poi la passione" è ancora valido quando si adottano nuovi strumenti.
È interessante notare come il modo in cui Anthropic e gli utenti esperti parlano di come trarre valore da Opus 4.7 rifletta un concetto più ampio riguardante le carriere e la padronanza: la passione tende a seguire la competenza, non a precederla. Jensen Huang di NVIDIA è noto per aver respinto il cliché "segui la tua passione", sostenendo che chi dà questo consiglio di solito vive già agiatamente, molto tempo dopo aver superato i primi anni difficili.
Lo stesso approccio mentale emerge quando si descrive come lavorare con un modello come Opus 4.7: scegliere un ambito in cui si possa diventare veramente forti, e poi dedicarsi a fondo per un lungo periodo. Anziché inseguire le mode del momento, scegli un settore – sistemi backend, automazione della sicurezza, ingegneria dei dati, strumenti di sviluppo – dove c'è una reale domanda e dove questo modello può far crescere le tue competenze nel corso degli anni, non delle settimane.
A prima vista, questo approccio sembra poco affascinante: si misurano i progressi anziché le sensazioni, si accetta che ci saranno attriti, noia e problemi, e si continua a ripetere l'esercizio. Le giornate difficili non sono la prova che hai scelto la strada sbagliata; di solito dimostrano che stai lavorando a qualcosa di importante. Nel contesto di Opus 4.7, questo significa che si perfezionano iterativamente i prompt, le pipeline e i flussi di revisione finché non risultano efficaci in produzione, invece di applicare il modello a progetti collaterali a caso e aspettarsi miracoli.
Man mano che acquisisci padronanza, sia della tua arte che degli strumenti come Opus 4.7 che la supportano, ti guadagni gradualmente il diritto di modificare la tua vita e il tuo stack. Avrai la possibilità di scegliere problemi più interessanti, team migliori e limiti più sani perché le tue competenze ora sono rare e affidabili. All'inizio, potresti sacrificare l'equilibrio per investire molto nell'apprendimento; in seguito, questo investimento ti permetterà di riacquistare tempo, controllo e flessibilità.
Il messaggio pratico per gli sviluppatori che adottano Claude Opus 4.7 è semplice: non limitatevi a sperimentare, ma adottate le modifiche necessarie. Considera il lavoro di migrazione, la messa a punto dei prompt, gli sforzi e gli esperimenti relativi al budget come gli anni di pratica che si celano dietro qualsiasi competenza seria. Col tempo, è così che si arriva a flussi di lavoro e agenti che cambiano davvero il modo in cui si sviluppa il software, invece dell'ennesimo strumento con cui "ci si è divertiti per un fine settimana".
Nel complesso, Claude Opus 4.7 offre un motore più preciso, concreto e performante per la programmazione, il lavoro intellettuale e le attività che richiedono una forte componente visiva, il tutto arricchito da controlli migliorati per il ragionamento e i costi, e circondato da un ecosistema come Claude Code, ottimizzato per il lavoro di ingegneria reale e complesso. Gli sviluppatori che accolgono questi cambiamenti, ripensano i loro prompt e le loro pipeline e forniscono al modello metodi concreti per verificare il proprio output, sono quelli che con maggiore probabilità avranno la sensazione di aver assunto un collaboratore instancabile e ossessionato dai dettagli, piuttosto che aver semplicemente aggiornato la funzione di completamento automatico a qualcosa di leggermente più intelligente.