- Il collasso del modello si verifica quando l'intelligenza artificiale generativa viene ripetutamente addestrata sui propri output sintetici, erodendo la diversità e la precisione.
- Questo circolo vizioso minaccia gli LLM utilizzati nella progettazione, nella codifica e nella consulenza, amplificando i pregiudizi e degradando le prestazioni delle minoranze e dei casi limite.
- La mitigazione richiede strategie di dati incentrate sull'uomo, tracciamento della provenienza, watermarking e un uso attento dei dati sintetici insieme alla generazione con recupero aumentato.
- La regolamentazione e l'uso responsabile da parte dell'uomo sono essenziali per mantenere l'intelligenza artificiale come amplificatore cognitivo, anziché lasciare che modelli e utenti si degradino nel tempo.

L'intelligenza artificiale generativa è diventata l'assistente di riferimento per la codifica, la scrittura, la progettazione e il processo decisionale, ma c'è un rischio crescente che quasi nessuno al di fuori della comunità di ricerca stia realmente prendendo in considerazione: Cosa succede quando questi sistemi vengono addestrati sempre di più sui propri output sintetici invece che su nuovi dati umani? Questo lento ciclo di autoalimentazione è ciò che i ricercatori hanno soprannominato collasso del modelloe le sue conseguenze vanno ben oltre qualche risposta sbagliata in un chatbot.
Quando il collasso del modello colpisce i modelli linguistici di grandi dimensioni (LLM) e i sistemi generativi utilizzati al loro interno strumenti di progettazione, strumenti di codifica e di lavoro cognitivo, il problema non è solo una perdita di accuratezza ma un degrado strutturale del modo in cui questi modelli rappresentano la realtà: Gli eventi rari scompaiono, i pregiudizi si amplificano, la creatività si restringe e l'intero ecosistema digitale inizia a riecheggiare le proprie distorsioni. Capire come funziona questo fenomeno, perché accade e cosa possiamo ancora fare per prevenirlo è diventato un problema strategico per i fornitori di intelligenza artificiale, gli enti regolatori e qualsiasi azienda che punti i propri processi su strumenti di progettazione basati sull'intelligenza artificiale.
Cosa intendono i ricercatori per “collasso del modello”
Un mantra di lunga data nell'apprendimento automatico afferma che un sistema di intelligenza artificiale è valido tanto quanto i dati da cui apprende, e il collasso del modello è ciò che accade quando quei dati smettono di riflettere il mondo reale e diventano dominati da contenuti generati dall'intelligenza artificiale. Una recente ricerca condotta da Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao e collaboratori nel Regno Unito e in Canada dimostra che i modelli generativi, ripetutamente perfezionati sui risultati delle generazioni precedenti, sviluppano difetti irreversibili che li rendono praticamente inutilizzabili.
Il meccanismo è ingannevolmente semplice: ogni volta che un nuovo modello viene addestrato su una combinazione di dati reali e dati sintetici provenienti da modelli precedenti, eredita non solo modelli utili, ma anche i loro errori e distorsioni.; poi aggiunge i propri errori. Iterazione dopo iterazione, queste distorsioni si accumulano e la distribuzione appresa si allontana dalla distribuzione originale dei dati, ricavata dagli esseri umani e dal mondo reale.
Nei loro esperimenti, i ricercatori hanno osservato due fasi distinte che hanno chiamato collasso del modello precoce e tardivo: Inizialmente, il modello inizia a "dimenticare" le code della distribuzione, ovvero i casi insoliti e a bassa frequenza, pur continuando a funzionare decentemente sui modelli comuni; in seguito, quando prevalgono i dati sintetici, la distribuzione crolla così bruscamente che non assomiglia più affatto ai dati originali e gli output del modello si trasformano in contenuti incoerenti o privi di senso.
Questa dinamica è particolarmente preoccupante per i grandi modelli linguistici addestrati su dati web aperti: Al momento, gli LLM si basano principalmente su testi scritti da persone, estratti da siti web, forum, repository di codice e pubblicazioni. Tuttavia, con l'ondata di post di blog, articoli, documentazione, frammenti di codice, immagini e persino articoli di ricerca scritti dall'intelligenza artificiale che inondano il web, i futuri corsi di formazione assorbiranno inevitabilmente una quota crescente di contenuti sintetici generati automaticamente.
Se questa tendenza autoreferenziale non viene attentamente controllata, ogni nuova generazione di modelli utilizzati negli strumenti di progettazione, nei copiloti di codifica o nei sistemi di contenuto imparerà sempre meno dagli esseri umani e sempre di più da copie imperfette di copie del proprio output passato. Nel corso del tempo, la capacità dei modelli di rappresentare fedelmente il mondo e di gestire i casi limite si è gradualmente erosa.
Perché i dati sintetici danneggiano i modelli generativi
I modelli generativi non riproducono i dati di addestramento alla lettera; comprimono i modelli in una distribuzione di probabilità e questa compressione enfatizza intrinsecamente ciò che è comune e attenua ciò che è raro. Quando tali modelli generano nuovi dati, i risultati tendono a raggrupparsi attorno alla massa centrale di tale distribuzione anziché agli estremi, quindi i campioni sintetici sono meno diversificati e meno ricchi dei dati originali da cui il modello ha appreso.
Il team di Shumailov ha formalizzato questa intuizione e ha dimostrato che l'addestramento ripetuto su dati sintetici introduce tre livelli di errore che si rafforzano a vicenda: errore di approssimazione statistica perché i modelli vedono sempre un campione finito della realtà, errore di espressività perché le architetture non possono rappresentare perfettamente distribuzioni complesse del mondo reale ed errore di apprendimento perché i metodi di ottimizzazione come la discesa del gradiente approssimano solo la soluzione ideale.
In esperimenti controllati con semplici modelli di probabilità, gli autori hanno dimostrato come, generazione dopo generazione, il modello perde informazioni sugli eventi a bassa probabilità e converge verso distribuzioni degeneri: nelle distribuzioni discrete, il modello collassa verso un singolo valore sovrarappresentato (una sorta di picco delta), mentre per le distribuzioni gaussiane la varianza si riduce verso zero, cancellando la variabilità.
Hanno poi esteso l'analisi ai modelli linguistici addestrando ripetutamente un modello OPT-125M su Wikitext-2, dove ogni nuovo set di addestramento includeva il testo generato dalle iterazioni precedenti: le prestazioni diminuirono gradualmente, il modello si spostò verso sequenze generiche ed eccessivamente probabili e iniziò a emettere frammenti strani e statisticamente improbabili, sintomi delle distorsioni accumulate previste dalla teoria.
Da un punto di vista pratico, ciò significa che anche quantità moderate di contenuto sintetico nel mix di addestramento possono far pendere il modello verso un comportamento distorto o fragile, molto prima che crolli completamente. Le forme linguistiche rare, i dialetti minoritari, gli argomenti insoliti o i modelli tecnici di nicchia sono i primi a scomparire, sostituiti da una sovrarappresentazione di ciò che è più comune nel flusso di dati sintetici.
Impatto sugli strumenti di progettazione, sugli assistenti di codifica e sul lavoro professionale
Le preoccupazioni relative al collasso del modello non si limitano a parametri di riferimento astratti; incidono direttamente sul funzionamento degli strumenti di progettazione, dei copiloti di programmazione e dei servizi professionali. Molte organizzazioni impongono già l'uso dell'intelligenza artificiale per almeno alcune user story per sprint, affidandosi a sistemi come GitHub Copilot o assistenti basati su Databricks per redigere il codice, riorganizzare i moduli o abbozzare le architetture.
L'aumento immediato della produttività è reale: gli sviluppatori risparmiano ore grazie a modelli appresi da milioni di righe di codice scritto da esseri umani; ma la domanda è cosa succederà quando, tra cinque o dieci anni, una quota significativa di quella base di codice sarà stata suggerita dall'intelligenza artificiale. Se i modelli futuri si baseranno su repository sempre più pieni di frammenti, commenti e dati standard generati dall'intelligenza artificiale, il ciclo di apprendimento inizierà ad assomigliare a un sistema "garbage in, garbage out" su scala planetaria.
Un modello simile sta emergendo nei flussi di lavoro relativi a contenuti e progettazione: blog aziendali, articoli di "esperti", descrizioni di prodotti, immagini di marketing e persino script di podcast sono ora frequentemente creati o ampiamente assistiti da strumenti come ChatGPT, Modelli Gemelli o IA di progettazione specializzate. Man mano che queste risorse sintetiche vengono pubblicate online e successivamente inserite in set di addestramento, i modelli apprendono da artefatti che erano già stati levigati, mediati e occasionalmente errati.
Ricercatori e professionisti spesso descrivono questo fenomeno come una camera di risonanza dell'intelligenza artificiale o, come ha detto un esperto, come un serpente che si morde la coda: una volta che i modelli consumano per lo più contenuti creati dall'intelligenza artificiale, ogni nuova generazione amplifica qualsiasi pregiudizio e semplificazione introdotta dalla precedente, e il sistema perde di vista la disordinata ma inestimabile diversità della reale espressione umana.
Nei servizi professionali, questo ciclo di feedback interagisce con un altro cambiamento strutturale: il crollo della classica piramide della leva finanziaria su cui le società di consulenza, legali e di revisione contabile hanno fatto affidamento per decenni. Per gran parte del XX secolo, le grandi aziende di servizi strategici e professionali hanno adottato un modello di business in cui eserciti di analisti junior elaboravano dati, costruivano modelli e redigevano report, mentre un piccolo gruppo di partner si assicurava la maggior parte del valore.
Come l’intelligenza artificiale generativa appiattisce la “piramide della leva finanziaria” della consulenza
Il fondamento economico della piramide della consulenza era semplice: un intenso lavoro analitico giustificava grandi team di junior e una fatturazione oraria, con la redditività determinata dal divario tra quanto pagato dai clienti e quanto costavano quei junior. Attività come la creazione di modelli finanziari, la compilazione di panoramiche di mercato, l'esecuzione di analisi SWOT o la stesura di presentazioni per i clienti erano tutte attività che richiedevano molto tempo, erano ripetibili e scalabili.
L'intelligenza artificiale generativa e l'automazione avanzata stanno infrangendo questa logica, assorbendo enormi quantità di lavoro cognitivo in una frazione del tempo e dei costi. Gli analisti del MIT Sloan e della Harvard Business School hanno dimostrato che gli strumenti generativi possono ridurre i tempi per le attività analitiche strutturate fino all'80%, minando fondamentalmente la necessità di grandi team alla base della piramide.
Commentatori come Joe Nocera hanno notato che compiti che un tempo richiedevano settimane o mesi a interi team possono ora essere abbozzati in pochi minuti da un consulente senior con un valido assistente AI, spingendo molte grandi aziende a ridurre silenziosamente le assunzioni di personale junior o ad avviare licenziamenti in ruoli con un elevato numero di analisti. Anche se non tutte le posizioni entry-level scompariranno, la logica economica per mantenere spessi strati di junior si sta chiaramente indebolendo.
Allo stesso tempo, i clienti e persino i governi stanno spingendo con forza per abbandonare la fatturazione basata su tempo e materiali e passare a contratti basati sul valore, incentrati su risultati misurabili. Con l'intelligenza artificiale che aumenta la produttività, diventa molto più difficile giustificare il pagamento di migliaia di ore di lavoro umano quando gran parte del lavoro di base può essere automatizzato, quindi la vecchia formula della leva finanziaria inizia a incrinarsi.
Il risultato netto è un graduale crollo della tradizionale struttura piramidale a favore di configurazioni più snelle: piccole boutique di esperti, micro-team che combinano il giudizio senior con strumenti di intelligenza artificiale pesanti e squadre di agenti di intelligenza artificialee professionisti senior indipendenti in grado di fornire risultati di alta qualità senza un ampio cast di supporto. In questo panorama, il valore unico non è più la capacità di mobilitare orde di analisti junior, ma la capacità di porre le domande giuste, progettare interventi e muoversi in ambienti complessi e pieni di vincoli.
Pregiudizi, dati di minoranza ed etica del collasso
Uno degli aspetti più preoccupanti del collasso del modello è il suo impatto non uniforme: tende a cancellare prima i segnali a bassa frequenza, il che in pratica spesso si traduce in minoranze, casi limite e scenari rari. Poiché i modelli generativi sono macchine probabilistiche orientate verso medie “sicure”, i loro output sintetici sovrarappresentano ciò che è comune nei dati di addestramento e sottorappresentano ciò che è raro ma comunque importante.
Come ha sottolineato la ricercatrice Emily Wenger, anche un semplice compito di generazione di immagini come "disegnare cani" tende gradualmente a gravitare verso le razze più comuni nel set di addestramento, come i golden retriever, mentre le razze rare praticamente scompaiono nel corso delle generazioni. Tradotta in termini linguistici e dati sociali, questa dinamica può ulteriormente emarginare gruppi già sottorappresentati.
Gli esperimenti con gli LLM mostrano che, nelle fasi iniziali del collasso, le prestazioni peggiorano prima sui dati di minoranza o a bassa frequenza, prima che il modello si rompa completamente. Ciò significa che l'equità e l'inclusione sono a rischio molto prima che il collasso diventi evidente per gli utenti finali, e gli strumenti integrati nei processi di progettazione o di processo decisionale potrebbero rivelarsi inefficaci per determinate popolazioni.
A livello politico, l'AI Act dell'Unione Europea inserisce queste preoccupazioni direttamente nel quadro normativo, ponendo l'accento sulla qualità dei dati, sulla proprietà intellettuale, sulla privacy, sulla protezione dei dati personali e sulla mitigazione dei pregiudizi. La legislazione riconosce implicitamente che i soli dati sintetici non possono garantire modelli di alta qualità e che un'inadeguata integrazione di contenuti generati dall'intelligenza artificiale nei corpora di formazione può entrare in conflitto sia con i principi etici sia con gli obblighi legali.
Esiste anche una dimensione culturale e cognitiva: se le persone si affidano all'intelligenza artificiale per sostituire completamente la propria scrittura, analisi o pensiero creativo, entrambe le parti si degradano. I modelli diventano meno radicati nelle sfumature umane e gli esseri umani rischiano di perdere proprio le competenze necessarie per utilizzare e supervisionare criticamente questi sistemi. Usata con saggezza, l'IA può amplificare il ragionamento, la creatività e la risoluzione dei problemi; usata come stampella, può accelerare un declino reciproco.
Scarsità di dati, intelligenza artificiale degli Asburgo e il web autodistruttivo
Un'osservazione ricorrente nei lavori recenti è che testi, immagini e codici umani di alta qualità non sono risorse infinite. Alcune proiezioni suggeriscono che la fornitura di testo pulito, diversificato e legalmente utilizzabile, scritto da esseri umani e adatto alla formazione di modelli di grandi dimensioni, potrebbe esaurirsi di fatto nel giro di pochi anni, spingendo i fornitori ad affidarsi maggiormente ai dati sintetici, a meno che non riescano ad assicurarsi l'accesso esclusivo a fonti premium.
Questo è uno dei motivi alla base dell'ondata di accordi di licenza sui contenuti tra aziende di intelligenza artificiale e grandi editori, organizzazioni giornalistiche e altri titolari di diritti. Iniziative come la famiglia modello della fondazione ALIA finanziata con fondi pubblici in Spagna riconoscono esplicitamente che ottenere set di dati umani di prim'ordine e ben curati è una priorità strategica se si vuole evitare di basarsi su materiale contaminato o di bassa qualità.
Allo stesso tempo, Internet si sta rapidamente saturando di contenuti generati dall'intelligenza artificiale: blog aziendali, post sui social, articoli SEO, immagini stock e persino articoli dall'aspetto accademico prodotti o scritti da sistemi generativi. Poiché i futuri LLM e gli strumenti generativi inevitabilmente si baseranno sulla stessa rete, la distinzione tra fonti umane e sintetiche diventa sempre più sfumata.
Il ricercatore Jathan Sadowski ha coniato il termine "IA asburgica" per esprimere l'idea di sistemi deformati da ripetuti auto-riproduzioni, come una linea genealogica che soffre di eccessiva consanguineità, e il concetto è diventato sinonimo di collasso del modello nei circoli degli esperti. La questione aperta è quanta quantità di dati sintetici sia eccessiva e dove si trovi il punto di svolta; le prove attuali suggeriscono che ciò dipenda in larga misura dalle dimensioni del modello, dall'architettura, dalla ricetta di addestramento e dalla qualità dei campioni sia reali che sintetici.
Per il momento, il consenso non è che i dati sintetici siano intrinsecamente dannosi, ma che il riciclaggio su larga scala e non filtrato degli output dell'IA in pipeline di addestramento senza tracciamento della provenienza, bilanciamento e controllo di qualità sia una ricetta per il degrado a lungo termine. Utilizzati con attenzione e combinati con solidi dati umani, i campioni sintetici possono talvolta rivelarsi utili; se usati come un sostituto economico della realtà, portano al collasso.
Strategie tecniche e di governance per evitare il collasso
Ricercatori e professionisti del settore stanno attivamente esplorando modi per mitigare o ritardare il collasso del modello, in particolare per i sistemi profondamente integrati negli strumenti di progettazione e nei flussi di lavoro aziendali. Diverse strategie complementari stanno emergendo sia da articoli accademici che dalla pratica industriale.
Il primo pilastro è la rigorosa provenienza dei dati e la filigrana dei contenuti: Grandi provider come Google, OpenAI e Meta già contrassegnano o stanno sperimentando l'applicazione di watermark ai loro output generati, in modo che le future pipeline di training possano identificare e filtrare i contenuti sintetici. Affinché ciò funzioni a livello di ecosistema, tali watermark (o almeno i loro metodi di rilevamento) devono essere condivisi o standardizzati, in modo che altri trainer di modelli possano escludere o ridurre in modo affidabile il materiale sintetico.
Un secondo pilastro è la conservazione e l'ampliamento dell'accesso alle fonti originali di dati umani: Archivi, redazioni, corpora curati, database specifici per dominio e repository di codice di alta qualità devono essere mantenuti, autorizzati e aggiornati periodicamente. Senza un flusso continuo di dati umani diversificati, anche le misure di mitigazione ben intenzionate non possono arrestare la deriva verso il predominio sintetico.
In terzo luogo, diversi studi indicano che un'attenta combinazione di dati sintetici e originali può attenuare o posticipare la fase distruttiva del collasso, sebbene non elimini completamente il rischio. L'idea è quella di utilizzare i dati sintetici in modo selettivo, ad esempio per bilanciare le classi, esplorare scenari rari o ampliare strutture sottorappresentate, mantenendo i dati umani come punto di riferimento della distribuzione.
La generazione aumentata tramite recupero (RAG) aggiunge un ulteriore potente livello di protezione separando il più possibile i parametri del modello dalla conoscenza fattuale. In una configurazione RAG, il modello generativo consulta una base di conoscenza esterna e verificata (documenti, database, librerie di progettazione, basi di codice) al momento dell'inferenza e basa le sue risposte sulle prove recuperate anziché basarsi esclusivamente su ciò che è stato memorizzato durante l'addestramento.
I provider cloud come Amazon descrivono RAG come un modo per ottimizzare i risultati dell'LLM costringendoli a fare riferimento a fonti autorevoli esterne al loro corpus di formazione prima di generare una risposta. Sebbene RAG non elimini l'imprevedibilità dei modelli generativi, può ridurre significativamente le allucinazioni e mitigare l'impatto delle rappresentazioni collassate ancorando i risultati alle conoscenze umane aggiornate.
Infine, alcuni esperti propugnano l’uso di “reset” periodici nei processi di formazione: anziché procedere a una messa a punto infinita di nuovi mix contaminati da sostanze sintetiche, le organizzazioni possono periodicamente riaddestrare o aggiornare i modelli principali su set di dati raccolti di recente, per lo più umani. Questo approccio è più costoso e tecnicamente impegnativo, ma aiuta a contrastare le distorsioni cumulative che determinano il collasso.
Regolamentazione, responsabilità e futuro della collaborazione uomo-IA
La pubblicazione dell'EU AI Act e di iniziative normative simili sottolineano che il collasso del modello non è solo una sfida tecnica, ma anche di governance e sociale. Ora i legislatori si aspettano che i fornitori di modelli documentino le fonti dei dati, rispettino la proprietà intellettuale, proteggano i dati personali e affrontino attivamente pregiudizi e correttezza: requisiti che sono più difficili da soddisfare se i set di addestramento sono pieni di contenuti sintetici non rintracciabili.
Per le aziende che adottano l'intelligenza artificiale nella progettazione, nello sviluppo software e nei servizi professionali, ciò significa che la due diligence del fornitore deve andare oltre le metriche di qualità del modello e includere domande sulla governance dei dati, sul monitoraggio della provenienza e sulle policy sui dati sintetici. Presumere ciecamente che "più dati sono sempre meglio" può ritorcersi contro se quei terabyte extra sono in gran parte rumore autogenerato.
Dal punto di vista individuale, il modo in cui i professionisti utilizzano l'intelligenza artificiale generativa determinerà sia l'evoluzione dei modelli sia le loro competenze. Esiste una differenza fondamentale tra l'utilizzo dell'intelligenza artificiale per esternalizzare completamente il lavoro di scrittura, analisi o progettazione e l'utilizzo come partner di pensiero per ampliare la creatività, testare idee e accelerare l'esplorazione, mantenendo al contempo il giudizio umano sul risultato finale.
Gli esperti di alfabetizzazione in materia di intelligenza artificiale sottolineano che se lasciamo che i modelli ci sostituiscano invece di potenziarci, rischiamo una doppia degradazione: sistemi addestrati su contenuti sempre più sintetici e a basso sforzo e esseri umani che perdono l'abitudine al ragionamento profondo, alla lettura attenta e alla creazione deliberata. Mantenere gli esseri umani saldamente “al di sopra” degli strumenti in termini di pensiero critico è essenziale se vogliamo che l’intelligenza artificiale continui a essere utile invece di trascinarci in una spirale discendente.
In definitiva, per evitare il collasso del modello, soprattutto nei motori di intelligenza artificiale integrati negli strumenti di progettazione e nelle piattaforme di lavoro cognitivo, sarà necessario un mix di soluzioni tecniche, pressioni normative e cambiamenti culturali nel modo in cui creiamo e consumiamo i contenuti digitali. Se si monitora la provenienza dei dati, si valorizzano e si proteggono le fonti generate dall'uomo, si utilizzano con moderazione i dati sintetici e l'intelligenza artificiale rimane un moltiplicatore di forza per la cognizione umana piuttosto che un sostituto, esiste ancora una chiara strada verso modelli che rimangano pertinenti, equi e accurati anziché crollare nell'irrilevanza autoreferenziale.