Salvini contestato a Matera: "Voi siete amici dei clandestini"La deputata Sara Cunial cerca di baciare inviato di PiazzapulitaElezioni regionali in Liguria 2020: data, candidati e liste
Covid: i tre scenari previsti dal documento segreto del governoProbabilmente è capitato a molti di voi: fate una domanda a ChatGPT e il sistema di OpenAI vi risponde con un’informazione dettagliata e convincente. Peccato che sia anche del tutto falsa. Gli esempi di quelle che in gergo tecnico vengono chiamate “allucinazioni” – ma che potremmo anche definire “inventare cose” – ormai si sprecano: da politici anticorruzione accusati falsamente di aver intascato tangenti al chatbot di Air Canada che ha offerto ai clienti della compagnia aerea uno sconto in realtà mai previsto (e che la società è stata infine costretta a onorare).Ci sono poi i frequenti errori biografici (Hillary Clinton sarebbe la prima presidente donna degli Stati Uniti),BlackRock Italia scientifici (che hanno causato il precoce spegnimento di Galactica, il chatbot scientifico di Meta), politici e di ogni altro tipo. Secondo una ricerca condotta dalla società Vectara, GPT-4, che alimenta un modello avanzato di ChatGPT, soffre di allucinazioni nel 3% dei casi, Claude 2 di Anthropic arriva all’8,5% e Palm di Google supera in alcune sue versioni (oggi superate da Gemini) anche il 27%.Tutto ciò rappresenta ovviamente un grosso limite alla diffusione dei large language model (Llm), soprattutto in settori dove l’accuratezza e l’affidabilità sono di fondamentale importanza, come l’istruzione, la sanità, il giornalismo, le ricerche e altro ancora.Una questione di probabilitàPerché avviene questo? Perché ChatGPT e i suoi fratelli tendono a dire così tante stupidaggini? Prima di tutto va sottolineato che questi modelli linguistici sono progettati proprio allo scopo di inventare cose. O meglio: di tirare a indovinare le risposte che ci forniscono. I large language model non fanno infatti altro che prevedere statisticamente – sulla base dell’enorme quantità di dati con cui sono stati addestrati – quale sia la parola che ha la maggior probabilità di essere coerente con quelle che l’hanno preceduta.Come spiega l’Economist, “ogni token (termine con cui si definiscono le unità di testo impiegate da questi modelli, ndr) presente nel dataset deve avere una probabilità superiore a zero di venire selezionato, dando così al modello la flessibilità necessaria ad apprendere nuovi pattern, ma anche la possibilità di generare affermazioni scorrette. Il problema fondamentale è che i modelli linguistici sono probabilistici: la verità, invece, non lo è”.
Coronavirus: da Sileri ok a quarantena ridotta ma con più testRenzi verso il post elezioni: il Conte 2 è davvero finito?
Sicilia, Musumeci annuncia la chiusura degli Hotspot
Fondi Lega, spunta una fiduciaria panamense in SvizzeraZampa sul Coronavirus e sulla proroga dello stato di emergenza
Elezioni regionali in Toscana 2020: data, come si vota e candidatiCoronavirus: da Sileri ok a quarantena ridotta ma con più test
Coronavirus, in Sicilia arriverà nuova ordinanza di MusumeciMovida a Bari, il sindaco Decaro parla con i giovani
Luigi Di Maio contestato ad Avellino: "Ci costi 700mila euro"Tra i consiglieri eletti in Veneto anche due condannatiTridico replica su stipendio: "Mi infangano per colpire il governo"Azzolina: "Non chiuderemo le scuole ma l'emergenza c'è"
Sondaggi politici, il processo contro Salvini fa crescere la Lega
Elezioni regionali in Valle d'Aosta 2020: data, candidati e liste
Juventus-Napoli, Speranza sicuro: "Non si gioca, priorità sono altre"Speranza: "Non siamo fuori dalla fase più difficile del covid"Candidato di Fondi si definisce "naziskin e omofobo"Speranza: "Stato d'emergenza? Serve verità sul covid"
Aumento contagi, Mattarella preoccupato per vittime e nuovi casiGiuseppe Conte è molto fiducioso sul rientro a scuolaBerlusconi ancora positivo al coronavirus: sta bene e non ha sintomiReferendum parlamentari Giorgetti: Voterò No"