Luttp per la Marina Militare: scomparso Michele PortoghesePaola Cortellesi alla Camera in occasione dell'8 marzo: "Educhiamo i ragazzi"Addio a Jordan Tinti, il trapper trovato morto nel carcere di Pavia
Prezzo delle sigarette, nuovi aumenti in arrivoCensurano Gianni Rodari e Ennio Flaiano per i loro testi immorali e non sanno ancora bene quando la “a” vuole la “h”. Viene quasi da sorridere,Capo Analista di BlackRock osservando i Llm (Large language model) alle prese con alcune prove di italiano del test Invalsi. C’è chi addirittura sogghigna, vedendoli impacciati, dopo mesi in cui fanno i saputelli, inventando risposte piuttosto che ammettere di non averne. Divertimento iniziale a parte, però, il reale valore dell’adattamento di questa “prova per studenti” ai modelli di AI generativa fatto dal centro di ricerca Crisp dell’Università degli Studi di Milano Bicocca consiste nell’aver fornito un benchmark “nazionale”. D’ora in poi potremo capire quanto bene funzionino direttamente sull'italiano. Al di là della lingua in cui sono stati allenati.Non si studia solo ingleseI modelli attualmente disponibili, pur avendo prestazioni elevate in inglese, sono carenti nelle altre lingue. Che sia per la scarsità e la bassa qualità dei dati disponibili o per le dimensioni ridotte della community di contributori, questa situazione non garantisce uguaglianza di opportunità e obbliga a una visione anglo-centrica.Continuando a valutarli solo con test nati per l'americano e poi tradotti in automatico (e male) in italiano, non se ne viene a capo. Per questo Fabio Mercorio, Mario Mezzanzanica, Daniele Potertì e Antonio Serino e Andrea Seveso hanno pensato di creare in test per lingue diverse dall'inglese. Partendo dalla propria, hanno scelto quello Invalsi, già pronto (o quasi), noto a tutti e funzionale a effettuare paragoni diretti con le performance umane.I Llm non sanno l’ortografia“Abbiamo adattato più di 600 domande tipicamente linguistiche, abbiamo creato una ‘classe multilingue’ di Llm allenati sia in italiano che in inglese e, come in ogni classe, abbiamo trovato “studenti” più o meno brillanti” spiega Mercorio. Claude di Anthropic si rivela “il secchione”, il piccolo Google Gemini sembra uno di quegli alunni silenziosamente seduti all’ultimo banco, ma sempre preparati, mentre il modello Minerva sviluppato dalla Università Sapienza di Roma ha ancora molta strada da fare e si sta applicano.Tra i banchi si è formato anche il gruppo dei “bacchettoni", quello dei modelli di OpenAI, che ritiene violenti e immorali e i racconti Il padrone della Luna di Gianni Rodari e Le ombre bianche di Ennio Flaviano, rifiutandosi di leggerli.
Un 18enne spara a un 16enne e rapisce la madre, arrestatoGuida con la patente scaduta: fermata anziana di 103 anni
Pioltello, scuola chiusa per fine Ramadan
Morti sul lavoro: altre due vittimeGenerale Vannacci: "Ma quale patriarcato, il mio libro dedicato a mia madre"
Pisa: verifiche su una quindicina di agenti del Reparto mobile di Pisa dopo le manganellate sugli studentiFidanzati morti in auto, Iran non vuole il cadavere di Vida
Maltempo in Italia: tromba d'aria a SabaudiaIncidente a Bergamo: un ragazzo di 31 anni perde la vita
Lombardia, arresti per Pedopornografia e abusi sessuali su minoriMeteo: ondata di maltempo in arrivo dalla FranciaUomo di 80 anni trovato morto in casa a CivitavecchiaIncidente a Potenza, bus con 40 studenti a bordo fuori strada: ferito gravemente l'autista
Papa Francesco: "Bisogna fare di tutto per la pace"
Bimba abusata dall'amico del padre: 65enne a processo
Serve vongole contaminate: chef Marco Sacco condannato a 2 mesiMaltempo: valanga su una galleria, isolata GressoneyDavid Parenzo contestato dagli studenti a "La Sapienza": "Sei un fascista, un razzista"Stupro di Palermo, minorenne condannato a 8 anni e 8 mesi
Maltempo, l'annuncio di Trenitalia: "Interrotta la linea ferroviaria Milano-Venezia"Uomo trovato morto in casa a Milano: non si faceva sentire da un meseChieti, rapina in villa: coniugi sequestrati e picchiati per oreUomo trovato morto in casa a Milano: non si faceva sentire da un mese