Amikor a Gemini 3 Flash nem tudja a választ, csak kitalálja.

A Gemini 3 Flash a gyors és okos mesterséges intelligencia modellje. De, egy független tesztcsoport értékelése szerint, ha olyat kérdezel tőlük, amiről nem igazán tud, az érthetetlen, nehéz, vagy a tudásából adódóan szinte mindig megpróbálja [...]
De egy független tesztcsoport értékelése szerint, ha olyat kérdez tőlük, amiről nem is tud, vagy amit nem tud, szinte mindig megpróbál válaszolni hazugsággal vagy találgatással.
A “a hallucinációk foka” (felismerési arány) az AA @ Omniscience benchmark bejegyzésnél, a Gemini 3 Flash elérte a 91 százalékát, ami azt jelenti, hogy még ha nem is volt helyes válasz, akkor is válaszolt, és gyakran teljesen feltalálták.
A “jelensége ismert probléma a szöveges generáció mintáiban: tudni, hogy mikor kell megállni és azt mondani, hogy “nem tudja” olyan fontos, mint tudni, hogyan kell válaszolni. A teszt szerint Gemini nem csinálja túl jól. Táblázat, Periszkóp.
Ez azonban nem jelenti azt, hogy a válaszainak 91% -a téved. Ez a szám csak azt mutatja, milyen gyakran talál fel valamit olyan helyzetekben, amikor az igazi válasz “nem tudja”.
Annak ellenére, hogy Gemini 3 Flash lehet nagyon erős, és jól teljesít az általános vizsgálatok, ő nagyon magabiztos, még akkor is, ha óvatosnak kell lennie, hogy ez lehet egy probléma súlyos használat. /Periszkóp












