Quando Gemini 3 Flash non conosce la risposta, si inventa.

Quando Gemini 3 Flash non conosce la risposta, si inventa.

Gemini 3 Flash è un modello di intelligenza artificiale veloce e intelligente. Ma, secondo una valutazione fatta da un gruppo di test indipendente, se chiedete loro qualcosa che non sa veramente è incomprensibile, difficile o per la sua conoscenza che quasi sempre proverà [...]

Ma, secondo una valutazione fatta da un gruppo di test indipendente, se chiedete loro qualcosa che non sa realmente, duro o fuori della sua conoscenza, cercherà quasi sempre di rispondere mentendo o inventando qualcosa.

Nelle prove di “il grado di allucinazioni” (tasso di riconoscimento) all'ingresso di Benchmark AA @Omniscience, Gemini 3 Flash ha raggiunto un fush del 91 per cento, il che significa che anche quando non c'era risposta corretta, ha risposto comunque, e spesso è stato completamente inventato.

Questo fenomeno di “è un problema noto nei modelli di generazione di testo: sapere quando fermarsi e dire “non sa che l'ipx2> è importante come sapere come rispondere. Secondo questo test, Gemini non lo fa molto bene, rapporti Telegrafia, trasmissione Pericolo.

Questo non significa, tuttavia, che il 91 per cento delle sue risposte sono sbagliate. Questa figura mostra solo quanto spesso inventa qualcosa in situazioni in cui la risposta reale sarebbe “doesn't know

Anche se Gemini 3 Flash può essere molto potente e eseguire bene su test generali, egli è molto auto - fiducioso anche quando dovrebbe stare attento che può essere un problema in uso serio. /Pericolo

Correlati
Elon Musk diventa il primo trilione del mondo

Elon Musk diventa il primo trilione del mondo

Facebook e Instagram offline

Facebook e Instagram offline

La prima missione spaziale periodica

La prima missione spaziale periodica

Audus presenta la supermacchina più veloce e potente della sua storia

Audus presenta la supermacchina più veloce e potente della sua storia

La Gran Bretagna utilizza l'intelligenza artificiale per verificare l'età dei richiedenti asilo

La Gran Bretagna utilizza l'intelligenza artificiale per verificare l'età dei richiedenti asilo

Buone notizie da YouTube: i video con intelligenza artificiale saranno chiaramente etichettati

Buone notizie da YouTube: i video con intelligenza artificiale saranno chiaramente etichettati

L'UE multa il gigante cinese Temu a 200m euro per giocattoli per bambini pericolosi e caricabatterie danneggiati

L'UE multa il gigante cinese Temu a 200m euro per giocattoli per bambini pericolosi e caricabatterie danneggiati

Internet è stato parzialmente restaurato in Iran, afferma l'organizzazione

Internet è stato parzialmente restaurato in Iran, afferma l'organizzazione

La Ferrari rappresenta la prima vettura elettrica, costa 640.000 dollari.

La Ferrari rappresenta la prima vettura elettrica, costa 640.000 dollari.

Stellantis presenta un ambizioso piano per nuovi modelli

Stellantis presenta un ambizioso piano per nuovi modelli

Perché non la ruggine d'oro? Gli scienziati rilevano “atomic ragionamento” a seguito della resistenza del metallo prezioso

Perché non la ruggine d'oro? Gli scienziati rilevano “atomic ragionamento” a seguito della resistenza del metallo prezioso

Musk perde la battaglia per il controllo OpenAI, la corte dà giustizia Altman

Musk perde la battaglia per il controllo OpenAI, la corte dà giustizia Altman

Mercedes - AMG ha scoperto la sua prima volta elettrica a quattro porte

Mercedes - AMG ha scoperto la sua prima volta elettrica a quattro porte