L’intelligenza artificiale open source? Un inganno

La promessa iniziale di Internet, l’accesso a contenuti universali, è svanita da tempo.
Inizialmente nata come infrastruttura priva di barriere, fino agli anni novanta e ai primi anni di questo millennio la rete era frequentata da persone che avevano il sogno di una fratellanza universale, indipendente da qualsiasi potere economico o politico. Quando però si è iniziato a comprendere il potenziale commerciale e strategico di Internet le cose sono cambiate. La rete è andata via via frammentandosi, sono sorti enormi monopoli tecnologici in grado di orientarla, con guadagni colossali.

Oggi la rete è un ambiente in feroce competizione economica.
E’ possibile una via che possa tenere insieme le libertà personali e le esigenze di una società pacifica, democratica e sicura?
Vittorio Bertola e Stefano Quintarelli ne parlano nel loro libro “Internet fatta a pezzi” uscito l’anno scorso per Bollati Boringhieri.

Sempre in quegli anni gli utenti sognatori erano non di rado gli stessi che Internet la costruivano pezzo per pezzo. E questo era possibile grazie all’open source, quella geniale idea che il software dovesse essere patrimonio dell’umanità, che agli utenti dovesse essere consentito di eseguire, copiare, distribuire, studiare, modificare e migliorare i software che usavano e che altri avrebbero usato.

Un’utopia digitale? Beh, può essere. Ma se ancora oggi software come Linux (che sta alla base di Android e di una smisurata quantità di device elettronici), WordPress, Firefox e tantissimi altri sono l’architrave della moderna tecnologia digitale vuol dire che non erano solo utopisti.

Purtroppo, così come il titolo del libro sopra citato, anche l’open source, il software libero, sono stati fatti a pezzi. Il giocattolo si è rotto, il sogno della fratellanza universale svanito del tutto. La feroce competizione economica non ha risparmiato nemmeno il software open source che si è trovato a prendere strade impervie, arrivando persino ad ammettere, nel caso dell’intelligenza artificiale, che è sufficiente che una piccola parte del processo di produzione del software sia aperta, per mettervi il marchio di “open source”.

Lo scorso 13 giugno 2024 è stato approvato il Regolamento UE 2024/1689 del Parlamento Europeo e del Consiglio che stabilisce regole armonizzate sull’intelligenza artificiale.
Il comma 12 dell’articolo 2 recita: “Il presente regolamento non si applica ai sistemi di IA rilasciati con licenza libera e open source”.
Via libera, ecco l’escamotage per continuare a costruire black box, sistemi oscuri, non tanto perchè gli algoritmi non possano essere liberi e disponibili ma perché non lo sono i dati su cui questi sistemi sono costruiti, non lo sono i filtri applicati a quei dati, non è disponibile e riproducibile l’intero processo di creazione dei “modelli”, dei “pesi”.
Ma cosa significano questi termini nuovi presenti nel regolamento europeo?

Siamo tutti abituati ad usare, ad esempio, del software per ascoltare canzoni, per guardare video o foto. C’è un programma informatico che “legge” i dati digitali e li trasforma in onde sonore o in puntini sullo schermo. Tanti puntini colorati sistemati in un certo modo danno l’impressione di una fotografia, tante fotografie in movimento, di una scena animata, e così via.
La distinzione tra programma lettore (o scrittore) e dati è netta. Ci scambiamo i file MP3, MP4, Doc, Xls, ecc. e questi vengono letti tutti allo stesso modo se il lettore è identico.
Con l’IA cambia il paradigma. Il “programma”, l'”algoritmo”, che per decenni hanno rappresentato la parte preponderante dell’informatica, sono stati scavalcati. A condurre il gioco oggi sono i dati, i “pesi”.

Cosa saranno mai questi pesi? Pensiamo ad un enorme labirinto, e come nel labirinto di Dedalo, i pesi sono il filo di Arianna. Sono dei percorsi per trovare l’uscita, diversa di volta in volta a secondo da dove si entra. Sono delle caselle con dei numeri dentro.
Sono milioni, miliardi di caselle, sono il frutto di un numero smisurato di calcoli, per ottenere i quali ci sono voluti ingenti investimenti in potenza computazionale, energia e dati “grezzi”.

L’intelligenza artificiale open source è quindi, allo stato attuale, impossibile. Si possono avere il modello, l’architettura, i parametri, aperti. Anche il file contenente i “pesi”, certo, ma non si può modificare quel file in modo sostanziale, non ricondurre i pesi ai dati grezzi, non eliminarne una parte, non ricrearli sulla base di altri dati grezzi.

Facciamo un esempio.

Mettiamo il caso che abbia a disposizione un sistema IA open source, nel senso autentico del termine, ovvero, tutto totalmente disponibile e aperto, compresi i dati usati per la creazione dei pesi.
Mi accorgo che c’è un “bug” (ora i bug vengono chiamati “allucinazioni”). Cioè chiedo alla chat AI: “Di che colore è il cielo?” e questa mi risponde: “Giallo”.
Il programma, l’algoritmo, non presenta anomalie, funziona benissimo con altri pesi, quindi l’anomalia deve necessariamente essere nei dati grezzi che hanno prodotto pesi errati.
Vado a leggere i dati “grezzi” e vedo che ci sono diecimila frasi con scritto: “Il cielo è giallo”. Essendo essenzialmente un sistema statistico, migliaia di frasi che per il sistema hanno valore assiomatico portano ad un risultato apparentemente incontrovertibile.

Trovato il bug, mi accingo a cancellare quelle diecimila frasi errate e a rieseguire il processo di creazione dei pesi.

Impossibile, avrei bisogno di computer enormi, energia infinita e molti mesi a disposizione.
L’intelligenza artificiale open source è un bluff, un trucco, un inganno. E’ solo l’ennesimo stratagemma per sfuggire alle regole, senza, stavolta, quell’utopia di fratellanza universale che ha caratterizzato gli anni d’oro dell’open source.

Captcha

Informatico di lungo corso, esperto di sistemi e tecnologie di rete. Presenza attiva su Internet già dalla seconda metà degli anni Novanta. Fautore dell'open data e dell'informatica consapevole. Fortemente critico della centralizzazione della Rete avvenuta a partire dal secondo decennio di questo millennio, auspica un ritorno alla decentralizzazione e alla democratizzazione di Internet.