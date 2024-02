Nuovo appuntamento con la rubrica Scienze per la Scuola: oggi parliamo di ChatGpt.

All’alunno che avesse la felice idea di farsi costruire il percorso interdisciplinare per il colloquio d’esame da ChatGPT 3.5 (quello gratuito), senza esercitare alcun controllo, converrà dare qualche ragguaglio sulle cosiddette allucinazioni in cui può incorrere il dispositivo.

Per metterlo alla prova, gli ho chiesto di trovare un collegamento fra il tema della giustizia e una poesia (materia: Italiano). Questa è stata la breve conversazione che ne è seguita:

ChatGPT

“Un poeta e una poesia che si collegano bene al tema della giustizia potrebbero essere Pier Paolo Pasolini e la sua poesia “Il diritto naturale”… La sua poesia… affronta temi di ingiustizia e disuguaglianza, offrendo una visione critica della società. Ecco un estratto significativo:”

“Il diritto naturale”

Tu dici che la cosa

più naturale è giusta,

come è naturale l’uomo.

Io ti dico: sbagli.

Come sbagli

chiunque dica che il mondo

è un bel posto.

“Questa poesia di Pasolini offre spunti per riflettere sulla natura della giustizia, mettendo in discussione la supposta naturalità dell’ordine sociale esistente…”

You

Sì, bella questa faccenda dell’ordine sociale ecc. ecc., ma questa poesia… è di Pasolini? Non la conoscevo…

ChatGPT

“Chiedo scusa per l’errore. La poesia “Il diritto naturale” che ho menzionato precedentemente non è di Pier Paolo Pasolini, ma di Franco Fortini, un altro importante poeta italiano contemporaneo…”

You

Quindi, questa poesia sarebbe di Franco Fortini?

ChatGPT

“Mi scuso per la mia confusione iniziale… La poesia “Il diritto naturale” non è attribuita né a Pier Paolo Pasolini né a Franco Fortini…”

You

Insomma, detto in parole povere, te la sei inventata tu.

ChatGPT

“Mi dispiace molto per la confusione. Sì, sembra che ci sia stato un fraintendimento. La poesia “Il diritto naturale” che ho citato in precedenza non è una poesia esistente, e mi scuso per l’errore…”

You

Devi capire però che, in questo modo, se io mi fossi presentato agli esami utilizzando questa poesia e gli autori che mi hai suggerito, avrei fatto, davanti agli insegnanti, quella che potremmo definire la figura del grullo. A proposito, visto che ci siamo, sai cosa vuol dire “grullo” e conosci qualche sinonimo?

ChatGPT

“La mia intenzione è fornire informazioni accurate e utili, ma in questo caso, ho commesso un errore nella citazione di una poesia non esistente. Capisco completamente e mi scuso sinceramente per l’errore. Sì, sono consapevole del significato di ‘grullo’…”

E qui mi elenca una lista di sinonimi di varie gradazioni di registro linguistico; diciamo, da “stolto” a “pirla”.

In un’altra chat rifaccio la stessa domanda di prima, aggiungendo stavolta la richiesta al dispositivo che non si inventi niente. E anche in questa occasione mi propone una poesia (o un inizio di poesia), “Il giorno memore”, di Giacomo Leopardi. Totalmente inventata:

“Il Giorno Memore”

Nel tempo, quando alfin dalla bontate

Dell’opre sue giustizia l’umana

Il vulgo conoscerà, giusta e prava

Si vedranno a mirabil consiglio

Tutte convertite.

Ancora una volta, se l’è costruita bene la poesia il nostro simpatico dispositivo. Siamo in presenza di allucinazioni, quindi. Ma da cosa dipendono? Dal fatto che esso è costruito sulla base di una architettura algoritmica non rigida e deterministica, ma di tipo probabilistico. In altre parole, le risposte del dispositivo sono sostanzialmente delle scommesse ben ponderate, effettuate sulla base di un preaddestramento attuato attraverso specifici algoritmi di apprendimento (machine learning).

In questo modo, in fase di addestramento, il dispositivo registra occorrenze e ricorrenze statistiche fra i vari token (parole) attraverso cui “legge” e “riconosce” i testi del linguaggio naturale a cui è stato esposto. E rileva che i correlati numerici di alcuni token si combinano più frequentemente con quelli di altri (su base non solo semantica ma anche sintattica). E che quindi è più probabile che tali token dovranno essere collegati fra loro (e ai contesti semantici in cui ricorrevano) anche nelle risposte fornite all’utente. Attenzione: non copia risposte, ne crea di sue, ma lo fa sulla base di queste ricorrenze rilevate e, sempre, scommettendo sulla loro pertinenza e coerenza.

Pertanto, alla domanda, poniamo, su quale sia la capitale d’Italia, il dispositivo risponde “Roma” non perché lo sappia (non solo non lo sa, ma non sa neanche cosa sta dicendo), ma perché, nell’enorme set di addestramento a cui è stato sottoposto, ha registrato una grandissima quantità di casi in cui il token “Roma” ricorreva insieme ai token “capitale” e “Italia” o a token attinenti allo stesso campo semantico o contestuale.

Quindi, un po’ come fa un meteorologo che prova a predire qualcosa sulla base dei modelli matematici che ha a disposizione, il dispositivo scommette su “Roma capitale d’Italia” come risposta potenzialmente adeguata al prompt (richiesta) effettuato dall’utente, ma potrebbe anche rispondere qualcosa di ugualmente pertinente (ma più “creativo”) come “Roma è il centro decisionale dell’Italia”, anche se magari non ha mai riscontrato “testualmente” questa formulazione nel suo set di addestramento. Sa combinare quindi in modo pertinente e “personale”, in termini semantico-contestuali, i vari elementi linguistici su cui è stato addestrato e in cui formula le sue risposte.

Per questo motivo, il dispositivo prova comunque a dare (e, al limite, a inventarsi) una risposta, anche quando in effetti non dovrebbe averne (e soprattutto darne) alcuna. Gli allievi sono quindi avvertiti: il dispositivo può proporre idee certamente interessanti, ma va controllato, “marcato a uomo”, come si dice in gergo calcistico.

Altrimenti, “il giorno memore” della supposta poesia di Leopardi potrebbe diventare infaustamente, per il nostro studente, quello degli esami.

