Quando Gemini 3 Flash non conosce la risposta, si inventa.

Gemini 3 Flash è un modello di intelligenza artificiale veloce e intelligente. Ma, secondo una valutazione fatta da un gruppo di test indipendente, se chiedete loro qualcosa che non sa veramente è incomprensibile, difficile o per la sua conoscenza che quasi sempre proverà [...]
Ma, secondo una valutazione fatta da un gruppo di test indipendente, se chiedete loro qualcosa che non sa realmente, duro o fuori della sua conoscenza, cercherà quasi sempre di rispondere mentendo o inventando qualcosa.
Nelle prove di “il grado di allucinazioni” (tasso di riconoscimento) all'ingresso di Benchmark AA @Omniscience, Gemini 3 Flash ha raggiunto un fush del 91 per cento, il che significa che anche quando non c'era risposta corretta, ha risposto comunque, e spesso è stato completamente inventato.
Questo fenomeno di “è un problema noto nei modelli di generazione di testo: sapere quando fermarsi e dire “non sa che l'ipx2> è importante come sapere come rispondere. Secondo questo test, Gemini non lo fa molto bene, rapporti Telegrafia, trasmissione Pericolo.
Questo non significa, tuttavia, che il 91 per cento delle sue risposte sono sbagliate. Questa figura mostra solo quanto spesso inventa qualcosa in situazioni in cui la risposta reale sarebbe “doesn't know
Anche se Gemini 3 Flash può essere molto potente e eseguire bene su test generali, egli è molto auto - fiducioso anche quando dovrebbe stare attento che può essere un problema in uso serio. /Pericolo












