Documenti giudiziari recentemente diventati di dominio pubblico indicano come l’azienda di intelligenza artificiale statunitense Anthropic abbia condotto in segreto un’operazione su larga scala, chiamata dall’azienda stessa “Project Panama”, per acquistare, digitalizzare, smembrare e poi riciclare milioni di copie di libri fisici destinati all’addestramento dei propri modelli di IA, come il chatbot Claude. In un documento analizzato dalla stampa, l’obiettivo del progetto viene descritto esplicitamente come quello di “scannerizzare distruttivamente tutti i libri del mondo”.
I dettagli di “Project Panama”, pubblicati in un articolo dal Washington Post sulla base dell’analisi di oltre 4mila pagine di atti processuali, indicano come Anthropic avrebbe speso decine di milioni di dollari per acquisire copie di libri cartacei usati in grandi quantità, tagliarne le coste, scansionarne le pagine in formato digitale e riciclare poi le copie originali smembrate. Secondo le stime dei fornitori coinvolti, l’operazione mirava a convertire tra 500mila e due milioni di volumi in pochi mesi.
Queste rivelazioni segnano un passaggio significativo nel rapporto tra industria dell’IA generativa, produzione culturale e copyright: dopo anni di scraping del web, l’industria dell’IA mostra ora di essere disposta a intervenire direttamente anche sul patrimonio cartaceo, trasformando biblioteche e cataloghi editoriali in materia prima per l’addestramento algoritmico dei suoi sistemi generativi. Anche al costo di distruggere parti consistenti di questo patrimonio analogico.
I nuovi atti, insieme ai documenti emersi in precedenti cause simili a tema copyright contro le aziende dell’IA, evidenziano però fino a che punto i gruppi tecnologici si spingano per raccogliere dati e informazioni da utilizzare per “nutrire” i loro sistemi. Alla luce di questi ultimi sviluppi, questa corsa non avverrebbe più soltanto verso i contenuti digitali: l’approccio estrattivo pare estendersi ora anche agli oggetti fisici, con la distruzione dei libri come costo collaterale considerato accettabile per la competizione tecnologica.
Le carte analizzate dal Washington Post mostrano inoltre che Anthropic avrebbe in precedenza scaricato grandi collezioni di libri piratati da “shadow libraries” online come Library Genesis. L’azienda afferma di non aver però utilizzato quei dataset per I suoi modelli commerciali. Pratiche simili in relazione all’utilizzo di versioni digitali e piratate di materiali protetti da copyright sono emerse anche in precedenza e nei confronti di altre aziende partecipanti alla medesima corsa competitiva per il dominio del settore dell’IA. Nel frattempo, l’uso dei libri da parte di Anthropic per il training delle sue AI è stato valutato come “fair use” in tribunale, ma l’approvvigionamento dei libri in digitale sarebbe avvenuto comunque in modo illegale. Paradossalmente, il procedimento tramite copie cartacee sarebbe invece una garanzia di legalità.
Al di là delle dispute giudiziarie, le rivelazioni del Washington Post – che è di proprietà di Jeff Bezos e che nelle ultime settimane è stato travolto da numerosi tagli e licenziamenti a pioggia - offrono uno spaccato raro sulla logica industriale che guida lo sviluppo dell’IA generativa: una corsa accelerata all’accumulazione di contenuti, in cui testi, immagini e ora anche libri fisici vengono trattati come risorse da estrarre, processare e consumare nel modo più ampio possibile.
La distruzione sistematica dei volumi cartacei per alimentare modelli commerciali, in particolare, solleva interrogativi più ampi sul modo in cui il settore dell’IA ha in considerazione la conoscenza, la cultura e la sua conservazione e conferma come l’economia dell’IA stia progressivamente estendendo il proprio perimetro estrattivo oltre il digitale, entrando direttamente nel mondo materiale, come dimostrano anche le foto pubblicate dal Washington Post che mostrerebbero il magazzino con i libri destinati al “Project Panama”. Se il copyright è certamente un terreno di scontro, la cui risoluzione non è di certo semplice, quello della postura di queste aziende nel modo in cui intendono la loro capacità di manovra e i pochi limiti che questa, nella loro accezione, dovrebbe avere.
Questa è una questione di potere più ampia e strutturale, nei confronti della quale il copyright (e la sua necessaria riforma) sembra poter fare ben poco: in gioco, infatti, vi è la corsa allo sviluppo del modello di intelligenza artificiale più performante, affidabile e, di conseguenza, più adottato su scala globale, in uno spazio ancora deregolamentato in cui le aziende competono per affermarne il controllo. In questo quadro, la distruzione dei libri non è soltanto un atto materiale, ma un gesto profondamente simbolico, che rivela una gerarchia di valori in cui i testi sembrano contare solo nella misura in cui possono essere scomposti, estratti e capitalizzati attraverso l’IA generativa, come se fossero dati digitali. Seguendo la metafora dell’estrattivismo – spesso utilizzata per descrivere il modo in cui le piattaforme digitali, e oggi le aziende dell’IA, trattano i dati come risorse naturali – anche i libri appaiono così ridotti a un giacimento da conquistare e sfruttare finché possibile, prima di orientarsi altrove.
Philip Di Salvo è senior researcher e docente presso l’Università di San Gallo. I suoi temi di ricerca principali sono i rapporti tra informazione e hacking, la sorveglianza di Internet e l’intelligenza artificiale. Come giornalista scrive per varie testate.
AI - La morte di internet?
Il giardino di Albert 07.02.2026, 17:00










