Když Gemini 3 Flash nezná odpověď, prostě si ji vymyslí.

Když Gemini 3 Flash nezná odpověď, prostě si ji vymyslí.

Gemini 3 Flash je model rychlé a chytré umělé inteligence. Ale podle hodnocení provedené nezávislou zkušební skupinou, pokud se jich zeptáte na něco, o čem opravdu neví, že je nepochopitelné, obtížné nebo z jeho znalostí bude téměř vždy snažit [...]

Ale podle hodnocení nezávislé testovací skupiny, pokud se jich zeptáte na něco, o čem opravdu neví, ať už tvrdě nebo ze svých znalostí, bude se téměř vždy snažit reagovat lhaním nebo vynalézáním něčeho.

V testech “stupeň halucinací” (míra rozpoznávání) na vstupu Benchmark AA @ Omniscience, Gemini 3 Flash dosáhl 91 procent fush, což znamená, že i když nebyla správná odpověď, odpověděl stejně, a často to bylo zcela vynalezené.

Tento fenomén “je známý problém ve vzorcích tvorby textu: vědět, kdy zastavit a říct “neví” je stejně důležité jako vědět, jak odpovědět. Podle tohoto testu to Gemini nedělá moc dobře, hlásí Telegraph, vysílání Periskop.

To však neznamená, že 91% jeho odpovědí je špatně. Tento obrázek ukazuje, jak často něco vynalézá v situacích, kdy skutečná odpověď je “neví”.

I když Gemini 3 Flash může být velmi silný a provádět dobře na obecné testy, je velmi sebejistý, i když by měl být opatrný, že to může být problém v seriózním použití. /Periskop

Related
Británie využívá umělé inteligence k ověření věku žadatelů o azyl

Británie využívá umělé inteligence k ověření věku žadatelů o azyl

Dobré zprávy z YouTube: Videa s umělou inteligencí budou jasně označena

Dobré zprávy z YouTube: Videa s umělou inteligencí budou jasně označena

EU uděluje pokutu čínskému obrovi Temu za 200 mil. EUR za nebezpečné dětské hračky a poškozené nabíječky

EU uděluje pokutu čínskému obrovi Temu za 200 mil. EUR za nebezpečné dětské hračky a poškozené nabíječky

Internet byl částečně obnoven v Íránu, říká organizace dozorčí

Internet byl částečně obnoven v Íránu, říká organizace dozorčí

Ferrari představuje první elektrické auto, stojí 640.000 dolarů.

Ferrari představuje první elektrické auto, stojí 640.000 dolarů.

Stellantis představuje ambiciózní plán pro nové modely

Stellantis představuje ambiciózní plán pro nové modely

Proč nezreziví zlato? Vědci zjišťují “atomové uvažování” po vytrvalosti drahých kovů

Proč nezreziví zlato? Vědci zjišťují “atomové uvažování” po vytrvalosti drahých kovů

Musk prohrává bitvu o OpenAI, soud dává Altmanovi spravedlnost.

Musk prohrává bitvu o OpenAI, soud dává Altmanovi spravedlnost.

Mercedes - AMG objevil svůj první čtyřdveřový elektrický trezor

Mercedes - AMG objevil svůj první čtyřdveřový elektrický trezor

Tento model Toyoty selže v bezpečnostních testech.

Tento model Toyoty selže v bezpečnostních testech.

Na trhu se objeví pilot robot “mecha”

Na trhu se objeví pilot robot “mecha”

Bitcoin padá pod $77.000

Bitcoin padá pod $77.000

Instagram kritizován pro “Instance”

Instagram kritizován pro “Instance”