Als Gemini 3 Flash het antwoord niet weet, verzint hij het gewoon.

Gemini 3 Flash is een model van snelle en slimme kunstmatige intelligentie. Maar, volgens een beoordeling van een onafhankelijke testgroep, als je hen iets vraagt dat hij niet echt weet is onbegrijpelijk, moeilijk of uit zijn kennis zal hij bijna altijd proberen [...]
Maar volgens een beoordeling van een onafhankelijke testgroep, als je ze iets vraagt waar hij niet echt van weet, hard of uit zijn kennis, zal hij bijna altijd proberen te reageren door te liegen of iets uit te vinden.
In de tests van “de mate van hallucinaties” (erkenningspercentage) bij de Benchmark entry AA @Omniscience bereikte Gemini 3 Flash een 91 procent fush, wat betekent dat zelfs wanneer er geen correct antwoord was, hij toch antwoordde, en vaak werd het volledig uitgevonden.
Dit fenomeen van “is een bekend probleem in tekstgeneratiepatronen: weten wanneer te stoppen en zeggen “weet niet” is net zo belangrijk als weten hoe te antwoorden. Volgens deze test doet Gemini dit niet zo goed, meldt Telegraaf, uitzending Periscoop.
Dit betekent echter niet dat 91 procent van zijn antwoorden verkeerd is. Deze figuur laat zien hoe vaak hij iets verzint in situaties waarin het echte antwoord “niet weet”.
Hoewel Gemini 3 Flash kan zeer krachtig en goed uit te voeren op algemene testen, hij is zeer zelfverzekerd - zelfs wanneer hij moet voorzichtig zijn dat het een probleem bij ernstig gebruik. /Periscoop











