Kiedy Gemini 3 Flash nie zna odpowiedzi, po prostu to zmyśla.

Gemini 3 Flash to model szybkiej i inteligentnej sztucznej inteligencji. Ale, zgodnie z oceną dokonaną przez niezależną grupę testową, jeśli zapytasz ich coś, czego on naprawdę nie wie jest niezrozumiały, trudne lub poza jego wiedzą będzie prawie zawsze spróbować [...]
Ale, zgodnie z oceną dokonaną przez niezależną grupę testową, jeśli zapytasz ich o coś, o czym on naprawdę nie wie, o czym nie wie, ciężko lub poza jego wiedzą, prawie zawsze będzie próbował zareagować przez kłamstwo lub wynalezienie czegoś.
W testach “stopień halucynacji” (wskaźnik rozpoznawania) w pozycji Benchmark AA @ Omniscience, Gemini 3 Flash osiągnął 91 procent fush, co oznacza, że nawet gdy nie było poprawnej odpowiedzi, odpowiedział i tak, a często to było całkowicie wymyślone.
Ten fenomen “jest znanym problemem w wzorach generowania tekstu: wiedzieć, kiedy przestać i powiedzieć “nie wiedzieć” jest tak ważne, jak wiedzieć, jak odpowiedzieć. Według tego testu, Gemini nie robi tego zbyt dobrze, doniesienia Telegraph, transmisja Peryskop.
Nie oznacza to jednak, że 91% jego odpowiedzi jest błędne. Ta liczba pokazuje, jak często coś wymyśla w sytuacjach, gdy prawdziwa odpowiedź byłaby “nie wie”.
Mimo, że Gemini 3 Flash może być bardzo potężny i dobrze wykonywać testy ogólne, jest bardzo pewny siebie - pewny siebie, nawet jeśli powinien być ostrożny, że może to być problem w poważnym użyciu. /Peryskop











