Il tema della memoria e dell’archiviazione in questa era di digitalizzazione avanzata e intelligenza artificiale è di estrema importanza e attualità. I contenuti digitali, infatti, così come le infrastrutture che li ospitano, non sono resistenti quanto crediamo, ed è fin troppo semplice che interi pezzi di conoscenza pubblicati su Internet, o informazioni di carattere documentale o storico di primo piano, possano, venendo cancellati, semplicemente sparire dalla memoria collettiva. Da tempo il tema è dibattuto assiduamente e, per porre rimedio al problema, diverse organizzazioni sono state create con lo scopo di contribuire alla conservazione della nostra memoria digitale.
Tra queste, l’Internet Archive è forse la più nota. L’Internet Archive è una biblioteca digitale senza scopo di lucro fondata nel 1996 a San Francisco da Brewster Kahle, con la missione di garantire “accesso universale a tutto il sapere”. Finora, l’Archivio ha reso disponibili cinquanta milioni di libri e testi, tredici milioni di registrazioni audio, dieci milioni di video, cinque milioni di immagini e un milione di programmi software, accessibili liberamente. Ogni giorno il suo sito, archive.org, riceve un milione di visite.
Inoltre, l’Internet Archive raccoglie le istantanee di miliardi di pagine web raccolte dalla sua Wayback Machine. Lo strumento è una fonte di primaria importanza che documenta ciò che avviene su Internet, lasciandolo consultabile per ragioni di ricerca o informazione. Se volete sapere come appariva un determinato sito web in un giorno particolare di quindici anni fa (qui la homepage di rsi.ch nel giugno del 2010, nda), ad esempio, la Wayback Machine è lo strumento che vi consente di scoprirlo, oltre a rendere accessibili contenuti magari scomparsi nel frattempo. Da questo nucleo originario sono nate organizzazioni autonome ma affini per missione, come l’Internet Archive Canada e l’Internet Archive Europe, alle quali si aggiunge ora l’Internet Archive Switzerland.
Una nuova sede svizzera della fondazione, indipendente e senza scopo di lucro, ha sede a San Gallo e mira a portare avanti ed espandere la missione dell’Archivio. Accanto al lavoro di consulenza per biblioteche, istituzioni e imprese interessate a utilizzare la piattaforma per i propri archivi pubblici, ha annunciato due progetti ambiziosi. Il primo si chiama Gen AI Archive e punta ad archiviare tutti i modelli di intelligenza artificiale oggi disponibili, e quelli che verranno. Realizzata in collaborazione con la School of Computer Science dell’Università di San Gallo**, diretta dal professor Damian Borth, l’iniziativa nasce da una constatazione: i grandi modelli linguistici che plasmano sempre più il modo in cui scriviamo, decidiamo e creiamo vengono addestrati, distribuiti, aggiornati e dismessi senza che resti alcuna traccia pubblica di ciò che erano e di come si comportavano.
Europa fuori dal tavolo AI
Alphaville 18.05.2026, 12:05
Contenuto audio
L’idea, però, non è quella di offrire una collezione di modelli pronti da utilizzare: come dichiarato dall’Executive Director dell’Internet Archive Switzerland Roman Griesfelder al St. Galler Tagblatt, questi vengono conservati a fini di ricerca e come “memoria” delle prime versioni e delle idee che le hanno generate. Preservarne tutte le versioni permetterà, in futuro, di ricostruirne l’evoluzione e di studiare i pregiudizi incorporati in tali sistemi o le tendenze sociali e culturali che li hanno accompagnati. Una memoria storica, insomma, di una tecnologia che cambia troppo in fretta per poter essere ricordata e studiata, in futuro, in modo approfondito.
Nello stesso momento in cui l’Internet Archive Switzerland si propone di costruire una memoria dell’intelligenza artificiale, l’Internet Archive originario sta perdendo pezzi di un’altra memoria, quella del giornalismo. Come ha documentato il Nieman Lab, infatti, oltre 340 testate locali statunitensi hanno iniziato a impedire all’Internet Archive di accedere ai propri articoli e di conservarli in via preventiva. La ragione è proprio l’IA generativa: gli editori temono, infatti, che le aziende tech attingano agli archivi dell’organizzazione per addestrare i propri modelli. La vicenda ricorda come proteggere il giornalismo come proprietà intellettuale può, in questo passaggio storico, anche significare esporlo al rischio di una condanna all’oblio come fonte storica, sottraendolo agli archivi che un giorno ne garantirebbero la sopravvivenza. In ogni caso, come osserva al Nieman Lab Meredith Broussard, docente alla New York University, non si tratta di una novità assoluta: è la stessa battaglia che si combatte con l’Internet Archive sin dalla sua nascita, con ora l’IA generativa a complicare ulteriormente la questione complessa del diritto d’autore.
https://www.rsi.ch/s/3599679
Secondo il Pew Research Center, un quarto delle pagine web esistenti tra il 2013 e il 2023 era già scomparso nel giro di dieci anni, e con esso quasi il 40% di quanto era online nel 2013: la rete, lungi dall’essere eterna, scompare e dimentica in fretta. In questo senso la funzione di conservazione e accessibilità fornita dall’Internet Archive è fondamentale per mantenere viva la memoria storica di quanto l’umanità ha pubblicato su Internet. Se l’intelligenza artificiale generativa è ormai una macchina che fabbrica conoscenza, archiviarne le versioni, come mira a fare la branca svizzera dell’Internet Archive, non significa soltanto preservare un software, ma conservare la memoria dei presupposti su cui si è fondato ciò che, sempre più spesso, prendiamo per vero.
*L’autore non è parte della School of Computer Science dell’Università di San Gallo e non è coinvolto nel progetto Internet Archive Switzerland
*Philip Di Salvo è senior researcher e docente presso l’Università di San Gallo. I suoi temi di ricerca principali sono i rapporti tra informazione e hacking, la sorveglianza di Internet e l’intelligenza artificiale. Come giornalista scrive per varie testate.
**L’autore non è parte della School of Computer Science dell’Università di San Gallo e non è coinvolto nel progetto Internet Archive Switzerland
Scaruffi.com: la Panda 4x4 del web, tra ricordi e libertà perdute
Kappa in libertà 19.05.2026, 17:50
Contenuto audio











