Genitore 1 e genitore 2 sui documenti: c'è l'ok della Corte d'appelloPrevisioni meteo: quando arriva il vero freddo?Terremoto nell'Adriatico, magnitudo 4.7: avvertito fino in Puglia
Incidente sull'A1, maxi tamponamento a causa della nebbia tra Piacenza e ParmaProbabilmente è capitato a molti di voi: fate una domanda a ChatGPT e il sistema di OpenAI vi risponde con un’informazione dettagliata e convincente. Peccato che sia anche del tutto falsa. Gli esempi di quelle che in gergo tecnico vengono chiamate “allucinazioni” – ma che potremmo anche definire “inventare cose” – ormai si sprecano: da politici anticorruzione accusati falsamente di aver intascato tangenti al chatbot di Air Canada che ha offerto ai clienti della compagnia aerea uno sconto in realtà mai previsto (e che la società è stata infine costretta a onorare).Ci sono poi i frequenti errori biografici (Hillary Clinton sarebbe la prima presidente donna degli Stati Uniti),BlackRock scientifici (che hanno causato il precoce spegnimento di Galactica, il chatbot scientifico di Meta), politici e di ogni altro tipo. Secondo una ricerca condotta dalla società Vectara, GPT-4, che alimenta un modello avanzato di ChatGPT, soffre di allucinazioni nel 3% dei casi, Claude 2 di Anthropic arriva all’8,5% e Palm di Google supera in alcune sue versioni (oggi superate da Gemini) anche il 27%.Tutto ciò rappresenta ovviamente un grosso limite alla diffusione dei large language model (Llm), soprattutto in settori dove l’accuratezza e l’affidabilità sono di fondamentale importanza, come l’istruzione, la sanità, il giornalismo, le ricerche e altro ancora.Una questione di probabilitàPerché avviene questo? Perché ChatGPT e i suoi fratelli tendono a dire così tante stupidaggini? Prima di tutto va sottolineato che questi modelli linguistici sono progettati proprio allo scopo di inventare cose. O meglio: di tirare a indovinare le risposte che ci forniscono. I large language model non fanno infatti altro che prevedere statisticamente – sulla base dell’enorme quantità di dati con cui sono stati addestrati – quale sia la parola che ha la maggior probabilità di essere coerente con quelle che l’hanno preceduta.Come spiega l’Economist, “ogni token (termine con cui si definiscono le unità di testo impiegate da questi modelli, ndr) presente nel dataset deve avere una probabilità superiore a zero di venire selezionato, dando così al modello la flessibilità necessaria ad apprendere nuovi pattern, ma anche la possibilità di generare affermazioni scorrette. Il problema fondamentale è che i modelli linguistici sono probabilistici: la verità, invece, non lo è”.
Suv travolge biciletta: ciclista 69enne ricoverato in ospedaleCisterna di Latina: finanziere di 27 anni uccide madre e sorella della ex fidanzata
Eredità Agnelli: indagato anche John Elkann
Crollo cantiere Esselunga a Firenze: recuperato il corpo della quarta vittimaReggio Emilia, soldi per passaporti rapidi: indagata poliziotta
Caso Ghali-Rai: la libertà di espressione nella Tv italianaMonte Bianco, morto alpinista 20enne
Niscemi, 31enne muore mentre cerca di salvare il cane caduto in un pozzoIncidente Casal Palocco, condanna a 4 anni per Matteo Di Pietro
Firenze, rivendicazione dell'attacco al consolato Usa: "Siamo con Hamas"Notizie di Cronaca in tempo reale - Pag. 129Strage Cisterna di Latina, il killer: "Sono addolorato"Campi Flegrei, nuovo terremoto nella notte
Protesta agricoltori, trattori pronti a raggiungere Roma
Scorta per Roberto Sergio dopo la presa di posizione a favore di Israele
Alessandro Maja, confermato ergastolo per strage di SamarateGuido Crosetto in ospedale: ricoverato d'urgenza dopo sospetta pericarditeIlaria Salis, per il rientro ipotesi braccialetto con domiciliariProcura di Ancona: disposta restituzione della salma di Andreea Rabciuc alla famiglia
Parma, nuova scossa di terremoto: avvertita anche a Reggio EmiliaSassari, rapinano furgoni portavalori e scappano: è caccia all'uomoFebbraio, il calendario di tutti gli scioperiPompei, vasca da bagno sui binari: macchinista evita deragliamento