La rivoluzione introdotta dai “Transformer” di Google Brain, evidenzia la capacità delle intelligenze artificiali di replicare il modo in cui gli esseri umani modulano l’attenzione in base al contesto. L’importante è gestire responsabilmente queste potenti tecnologie. Ce ne parla Francesco D’Amico, fisico e addestratore d’intelligenze artificiali.
L’avvento delle AI: luci e ombre
ChatGPT e simili AI generative sono ormai entrate nella vita di molti di noi. Qualche anno fa sarebbero sembrate magia, ora le usiamo con lo stesso stupore con cui ci meravigliamo ogni giorno che una tavola nera appesa in salone può prendere vita facendoci vedere il festival di Sanremo.
Queste nuove tecnologie sono capaci di generare testo, immagini o altri tipi di dati in modo incredibilmente autonomo e creativo. La qualità delle loro produzioni è incrementata notevolmente e nel giro di pochi anni: oggi sono in grado di comprendere il contesto in cui sono inserite e produrre risposte coerenti e significative. In sostanza, possono “creare” contenuti piuttosto che limitarsi a rispondere a domande, aprendo le porte a un nuovo mondo di possibilità. Nella vita quotidiana le AI generative ci assistono in molti compiti. Dagli assistenti vocali che rispondono alle nostre domande alle chatbot che forniscono supporto clienti, dai motori di ricerca intelligenti che ci spiegano come fare le faccende di casa, ai Large Language Models (LLM) che ci aiutano a scrivere mail, messaggi di auguri o CV, l’impatto delle AI generative è palpabile.
Nel settore dell’istruzione, le AI generative stanno aprendo nuovi orizzonti. Da una parte ChatGPT può fungere da tutor virtuale, rispondendo alle domande degli studenti e fornendo spiegazioni dettagliate su una vasta gamma di argomenti. La sua capacità di adattarsi al linguaggio e al livello di comprensione dell’utente lo rende uno strumento prezioso per la personalizzazione dell’apprendimento. Ma d’altra parte ChatGPT può essere usato per copiare una versione di latino con uno stile compatibile a quello di uno studente, oppure per risolvere problemi di matematica o fisica durante le verifiche.
Inoltre, l’applicazione delle AI generative nell’ambito lavorativo è forse una delle trasformazioni più significative. I LLM possono essere sfruttati per la scrittura di report, email e documenti aziendali, accelerando notevolmente i processi di produzione. L’automazione della generazione di testo libera tempo prezioso per i professionisti, consentendo loro di concentrarsi su attività più complesse e strategiche. Nei settori della programmazione e dello sviluppo software, ChatGPT può aiutare nella creazione di codice informatico, riducendo gli errori e aumentando l’efficienza.
Introduzione scritta con l’aiuto di ChatGPT
Invece: cosa c’entrano la facoltà umana dell’attenzione e le buche di Roma nelle nuove AI che generano testi, come ChatGPT?
La vera rivoluzione è avvenuta con l’inventore dei “Transformer” di A. Vaswani et al, del team di Google Brain, da non confondere con i “mostri” Hasbro con cui i ragazzi di oggi sono cresciuti. I modelli precedenti di intelligenza artificiale -dove “modelli” e “architetture” sono le parole noiose con cui chiamiamo i “cervelli artificiali” -, davano sostanzialmente la stessa importanza a tutte le parole lette per comprendere un testo. Contrariamente, noi umani, leggendo, diamo molta importanza ad alcune parole e quasi ignoriamo molte altre.
In realtà questo è un discorso generico, non riguarda solo la lettura. Quando guidiamo, ci concentriamo sulle altre auto, sui segnali stradali, sulle linee dell’asfalto. Per chi è di Roma, anche sulle buche, anzi soprattutto sulle buche, ma questo è un altro discorso. Se vogliamo evitare incidenti, non ci mettiamo a leggere le insegne dei negozi dall’altro lato della strada, le persone sul marciapiede, le nuvole nel cielo. Eppure tutte queste cose sono nel nostro campo visivo: siamo noi a decidere di non dargli importanza. Noi chiamiamo questo “attenzione”: imparare a dare importanza alle cose in base al contesto in cui ci troviamo. Un altro punto di vista, nei fatti uguale ma nell’interpretazione opposto, è quello della “disattenzione”: non impariamo a dare importanza a quello che è più rilevante, al contrario impariamo a ignorare ciò che è irrilevante. Quando siamo passeggeri spesso ci concentriamo proprio sulle insegne dei negozi e sui passanti piuttosto che sui cartelli stradali. Ovvero, ignoriamo quello che non ci interessa o non ci sembra rilevante. E’ semplice intuire quanto sia importante l’attenzione (e la disattenzione) per svolgere un compito, mentre è un altro conto costruire un cervello artificiale che metta in atto questo comportamento. La svolta notevole dell’invenzione dei Transformer è stata la loro relativa semplicità di funzionamento e la loro capacità innata di imparare a dare attenzione a quello che conta ignorando le cose irrilevanti. C’è un altro dettaglio relativo all’attenzione che diamo alle cose: dipende dalla situazione. Non diamo attenzione sempre alle stesse cose, decidiamo di volta in volta. Quando guidiamo diamo importanza a quello che si trova davanti alla nostra auto. Ma se ci troviamo su un rettilineo e dobbiamo svoltare in una traversa, in modo molto naturale cominciamo a dare attenzione al bordo della strada, in cerca della via in cui dobbiamo svoltare. Se siamo fermi al semaforo non continuiamo a fissare la strada e la macchina di fronte a noi, e se sappiamo che il semaforo verde non scatterà a breve la nostra attenzione può ricadere per qualche istante su tutt’altro. Abbiamo imparato che è inutile guardare un semaforo che rimarrà rosso per un altro minuto, talvolta guardiamo quello pedonale perché sappiamo che finché non diverrà rosso non sarà il nostro turno. Questo meccanismo di modulare l’attenzione in base al contesto in cui ci troviamo è una caratteristica molto più astratta e complessa della semplice attenzione. Molti animali (noi compresi) danno sempre più importanza al colore rosso perché è quello del sangue, mentre è una facoltà molto più avanzata imparare a decidere su cosa concentrarsi in base al contesto. Eppure, grazie al meccanismo chiamato “self-attention” su cui si basano i Transformer, le intelligenze artificiali sono in grado di imparare a replicarla. Nel giro di qualche anno e con dei successivi piccoli miglioramenti, Transformer con miliardi di neuroni addestrati a comprendere e simulare miliardi di testi hanno portato a Chat-GPT (dove la T finale sta appunto per Transformer). Quando scriviamo una frase, questa AI decide che importanza dare a ogni parola in base al discorso generale che stiamo affrontando, ignorando le parti irrilevanti.
Conclusioni
Alla fine di questo discorso, bisogna quindi ricordare l’importanza dell’ ispirazione biologica per creare AI migliori – questione descritta con l’aiuto a ChatGPT per l’introduzione all’articolo -, e l’importanza nell’usare bene strumenti potenti come AI. Come ogni strumento, le AI ci rendono più potenti, ma poi dobbiamo imparare a gestire quel potere. A Roma parliamo in modo molto appassionato di tematiche tanto importanti quanto superate come la gestione dei rifiuti, delle strade e del traffico, dei trasporti pubblici. Non ho mai sentito qualcuno parlare in modo rilevante di come queste tecnologie impatteranno negativamente sulla nostra vita. E’ ben noto che le AI, se non correttamente addestrate e utilizzate, tendono ad avere pregiudizi sulle persone e in generale a funzionare in modo non molto comprensibile. Ad esempio, se usate in un concorso pubblico, potrebbero discriminare abitanti delle periferie o di quartieri disagiati. Se usate per progettare una metro potrebbero favorire quartieri ricchi con una maggiore presenza di laureati in quanto più produttivi e necessari per il funzionamento di grandi aziende, sfavorendo quartieri meno fortunati in base a motivazioni che noi riteniamo discriminatorie. La cosa importante da sottolineare è che il problema non sono le AI, ma il modo sbagliato in cui le potremmo usare. La linea di ricerca di cui io – un addestratore delle intelligenze artificiali – faccio parte, prova a rendere il loro funzionamento interno più comprensibile, e questa potrebbe essere una caratteristica chiave per utilizzarle in modo corretto. Il progetto del tracciato di una metro fatto da umani è comprensibile: possiamo chiedergli la motivazione delle loro scelte in una conferenza stampa. Ad oggi, è difficile e talvolta impossibile comprendere perché una AI favorisca delle scelte a discapito di altre. Una generazione di ingegneri, fisici e matematici sta lavorando in questa direzione. Il sentimento diffuso è che la comprensibilità delle scelte dell’IA (chiamata “Explenaibility”) sarà fondamentale per renderle uno strumento realmente utile. Forse troveremo le risposte nella natura, o forse nelle teorie matematiche e fisiche del passato, oppure non le troveremo mai. Chissà se quando avremo risolto i problemi del nostro secolo, a Roma avremo risolto quelli del secolo scorso.
Francesco D’Amico, Lumi Online Journal