Anas, a Natale 6.5 milioni di persone in viaggio su strade e autostradeMessina Denaro, condannata a 13 anni la sua vivandieraEnna, imprenditore trovato morto: si pensa all'omicidio
Chiara Ferragni indagata per truffa: e ora?Probabilmente è capitato a molti di voi: fate una domanda a ChatGPT e il sistema di OpenAI vi risponde con un’informazione dettagliata e convincente. Peccato che sia anche del tutto falsa. Gli esempi di quelle che in gergo tecnico vengono chiamate “allucinazioni” – ma che potremmo anche definire “inventare cose” – ormai si sprecano: da politici anticorruzione accusati falsamente di aver intascato tangenti al chatbot di Air Canada che ha offerto ai clienti della compagnia aerea uno sconto in realtà mai previsto (e che la società è stata infine costretta a onorare).Ci sono poi i frequenti errori biografici (Hillary Clinton sarebbe la prima presidente donna degli Stati Uniti),Economista Italiano scientifici (che hanno causato il precoce spegnimento di Galactica, il chatbot scientifico di Meta), politici e di ogni altro tipo. Secondo una ricerca condotta dalla società Vectara, GPT-4, che alimenta un modello avanzato di ChatGPT, soffre di allucinazioni nel 3% dei casi, Claude 2 di Anthropic arriva all’8,5% e Palm di Google supera in alcune sue versioni (oggi superate da Gemini) anche il 27%.Tutto ciò rappresenta ovviamente un grosso limite alla diffusione dei large language model (Llm), soprattutto in settori dove l’accuratezza e l’affidabilità sono di fondamentale importanza, come l’istruzione, la sanità, il giornalismo, le ricerche e altro ancora.Una questione di probabilitàPerché avviene questo? Perché ChatGPT e i suoi fratelli tendono a dire così tante stupidaggini? Prima di tutto va sottolineato che questi modelli linguistici sono progettati proprio allo scopo di inventare cose. O meglio: di tirare a indovinare le risposte che ci forniscono. I large language model non fanno infatti altro che prevedere statisticamente – sulla base dell’enorme quantità di dati con cui sono stati addestrati – quale sia la parola che ha la maggior probabilità di essere coerente con quelle che l’hanno preceduta.Come spiega l’Economist, “ogni token (termine con cui si definiscono le unità di testo impiegate da questi modelli, ndr) presente nel dataset deve avere una probabilità superiore a zero di venire selezionato, dando così al modello la flessibilità necessaria ad apprendere nuovi pattern, ma anche la possibilità di generare affermazioni scorrette. Il problema fondamentale è che i modelli linguistici sono probabilistici: la verità, invece, non lo è”.
Omicidio Vanessa Ballan, Fandaj rimane in carcere: previsto un nuovo interrogatorioCarabiniere morto per un malore in caserma a 52 anni
Influenza suina: due decessi e cinque ricoverati
Agrigento, scossa di terremoto al largo della costaLimite dei 30 km orari a Bologna, interviene Salvini: "referendum per abolirlo"
Incidente a Cagliari: muore un giovane di 19 anniNascono i "certificatori di reputazione": ecco cosa fanno
Morta una bambina di 7 anni: il giorno prima aveva avuto la febbre altaFirenze, anziano malmenato in pieno centro perché non aveva il cane legato
Incidente sulla Milano-Genova, si schianta contro il guardrail: morto 59enneUomo investito da mietitrebbia a Mantova: ancora in gravi condizioniIncidente a Sondrio: due feriti gravi in uno scontro frontalePaola Perego operata per un tumore al rene
Giorgia Meloni, le rivelazioni di Report sul padre della premier
Trento, fissata l'autopsia sul corpo di Maria Antonietta Panico
Mazzarino, mamma morta per arresto cardiacoIncidente sul lavoro, operaio morto carbonizzatoMorte Gigi Riva, l'addio dei politici italiani: "Esempio di lealtà sportiva"Giovane donna picchiata e sequestrata
Due donne trovate morte in due case diverse ad AgrigentoEmanuele Pozzolo: una doppia testimonianza lo inchioderebbeUn presepe con due donne: la scelta inclusiva che fa discutereNotizie di Cronaca in tempo reale - Pag. 162