Als Gemini 3 Flash het antwoord niet weet, verzint hij het gewoon.

Als Gemini 3 Flash het antwoord niet weet, verzint hij het gewoon.

Gemini 3 Flash is een model van snelle en slimme kunstmatige intelligentie. Maar, volgens een beoordeling van een onafhankelijke testgroep, als je hen iets vraagt dat hij niet echt weet is onbegrijpelijk, moeilijk of uit zijn kennis zal hij bijna altijd proberen [...]

Maar volgens een beoordeling van een onafhankelijke testgroep, als je ze iets vraagt waar hij niet echt van weet, hard of uit zijn kennis, zal hij bijna altijd proberen te reageren door te liegen of iets uit te vinden.

In de tests van “de mate van hallucinaties” (erkenningspercentage) bij de Benchmark entry AA @Omniscience bereikte Gemini 3 Flash een 91 procent fush, wat betekent dat zelfs wanneer er geen correct antwoord was, hij toch antwoordde, en vaak werd het volledig uitgevonden.

Dit fenomeen van “is een bekend probleem in tekstgeneratiepatronen: weten wanneer te stoppen en zeggen “weet niet” is net zo belangrijk als weten hoe te antwoorden. Volgens deze test doet Gemini dit niet zo goed, meldt Telegraaf, uitzending Periscoop.

Dit betekent echter niet dat 91 procent van zijn antwoorden verkeerd is. Deze figuur laat zien hoe vaak hij iets verzint in situaties waarin het echte antwoord “niet weet”.

Hoewel Gemini 3 Flash kan zeer krachtig en goed uit te voeren op algemene testen, hij is zeer zelfverzekerd - zelfs wanneer hij moet voorzichtig zijn dat het een probleem bij ernstig gebruik. /Periscoop

Related
De Ferrari vertegenwoordigt de eerste elektrische auto, het kost $640.000.

De Ferrari vertegenwoordigt de eerste elektrische auto, het kost $640.000.

Stellantis presenteert ambitieus plan voor nieuwe modellen

Stellantis presenteert ambitieus plan voor nieuwe modellen

Waarom roest goud niet? Wetenschappers detecteren “atomaire redenering” na het uithoudingsvermogen van edelmetaal

Waarom roest goud niet? Wetenschappers detecteren “atomaire redenering” na het uithoudingsvermogen van edelmetaal

Musk verliest strijd voor OpenAI controle, rechtbank geeft Altman gerechtigheid

Musk verliest strijd voor OpenAI controle, rechtbank geeft Altman gerechtigheid

Mercedes - AMG ontdekte zijn eerste vierdeurs elektrische kluis

Mercedes - AMG ontdekte zijn eerste vierdeurs elektrische kluis

Dit Toyota model faalt op veiligheidstests

Dit Toyota model faalt op veiligheidstests

De proefrobot “mecha” verschijnt op de markt

De proefrobot “mecha” verschijnt op de markt

Bitcoin valt onder $77.000

Bitcoin valt onder $77.000

Instagram bekritiseerd voor “Instances”

Instagram bekritiseerd voor “Instances”

De proefrobot “mecha” verschijnt op de markt

De proefrobot “mecha” verschijnt op de markt

Na 70 jaar markeert Honda haar eerste jaarlijkse verlies

Na 70 jaar markeert Honda haar eerste jaarlijkse verlies

Wat App waarschuwt gebruikers voor noodupdate

Wat App waarschuwt gebruikers voor noodupdate

De C3 elektrische Citroen in Duitsland kost nu slechts 7.990 euro. Hoe is dat mogelijk?

De C3 elektrische Citroen in Duitsland kost nu slechts 7.990 euro. Hoe is dat mogelijk?