Ko Gemini 3 Flash ne pozna odgovora, si ga izmisli.

Gemini 3 Flash je model hitre in pametne umetne inteligence. Toda, po oceni neodvisne testne skupine, če jih vprašate nekaj, kar v resnici ne ve je nerazumljivo, težko ali iz svojega znanja bo skoraj vedno poskušal [...]
Toda po oceni neodvisne testne skupine, če jih vprašate nekaj, za kar ne ve, trdo ali iz svojega znanja, se bo skoraj vedno poskušal odzvati z lažjo ali izumom nečesa.
V testih “stopnje halucinacij” (stopnja prepoznavnosti) pri referenčnem vnosu AA @Omniscience je Gemini 3 Flash dosegel 91 odstotkov fush, kar pomeni, da je tudi takrat, ko ni bilo pravilnega odgovora, vseeno odgovoril in je bil pogosto popolnoma izmišljen.
Ta pojav “je znan problem v vzorcih ustvarjanja besedil: vedeti, kdaj se ustaviti in reči “ne ve” je enako pomembno kot vedeti, kako odgovoriti. Po tem testu, Gemini tega ne počne dobro, poroča Telegraph, oddaja Periskop.
To pa ne pomeni, da je 91 odstotkov njegovih odgovorov napačnih. Ta številka samo kaže, kako pogosto izumlja nekaj v situacijah, ko bi bil pravi odgovor “ne ve”.
Čeprav je Gemini 3 Flash lahko zelo močan in dobro opravlja splošne teste, je zelo samozavesten tudi, ko bi moral biti previden, da je to lahko problem pri resni uporabi. /Periskop












