Amikor a Gemini 3 Flash nem tudja a választ, csak kitalálja.

Amikor a Gemini 3 Flash nem tudja a választ, csak kitalálja.

A Gemini 3 Flash a gyors és okos mesterséges intelligencia modellje. De, egy független tesztcsoport értékelése szerint, ha olyat kérdezel tőlük, amiről nem igazán tud, az érthetetlen, nehéz, vagy a tudásából adódóan szinte mindig megpróbálja [...]

De egy független tesztcsoport értékelése szerint, ha olyat kérdez tőlük, amiről nem is tud, vagy amit nem tud, szinte mindig megpróbál válaszolni hazugsággal vagy találgatással.

A “a hallucinációk foka” (felismerési arány) az AA @ Omniscience benchmark bejegyzésnél, a Gemini 3 Flash elérte a 91 százalékát, ami azt jelenti, hogy még ha nem is volt helyes válasz, akkor is válaszolt, és gyakran teljesen feltalálták.

A “jelensége ismert probléma a szöveges generáció mintáiban: tudni, hogy mikor kell megállni és azt mondani, hogy “nem tudja” olyan fontos, mint tudni, hogyan kell válaszolni. A teszt szerint Gemini nem csinálja túl jól. Táblázat, Periszkóp.

Ez azonban nem jelenti azt, hogy a válaszainak 91% -a téved. Ez a szám csak azt mutatja, milyen gyakran talál fel valamit olyan helyzetekben, amikor az igazi válasz “nem tudja”.

Annak ellenére, hogy Gemini 3 Flash lehet nagyon erős, és jól teljesít az általános vizsgálatok, ő nagyon magabiztos, még akkor is, ha óvatosnak kell lennie, hogy ez lehet egy probléma súlyos használat. /Periszkóp

Related
Nagy-Britannia mesterséges intelligenciával ellenőrzi a menedékkérők korát

Nagy-Britannia mesterséges intelligenciával ellenőrzi a menedékkérők korát

Jó hírek a YouTube-ról: A mesterséges intelligenciával rendelkező videókat egyértelműen megjelölik

Jó hírek a YouTube-ról: A mesterséges intelligenciával rendelkező videókat egyértelműen megjelölik

Az EU 200 millió eurós pénzbírságot szabott ki Temu kínai óriás veszélyes gyermekjátékokra és sérült töltőkre

Az EU 200 millió eurós pénzbírságot szabott ki Temu kínai óriás veszélyes gyermekjátékokra és sérült töltőkre

Az internet részben visszaállt Iránba, mondja a szervezet felügyelője

Az internet részben visszaállt Iránba, mondja a szervezet felügyelője

A Ferrari képviseli az első elektromos autót, 640,000 dollárba kerül.

A Ferrari képviseli az első elektromos autót, 640,000 dollárba kerül.

A Stellantis ambiciózus tervet nyújt be az új modellekre

A Stellantis ambiciózus tervet nyújt be az új modellekre

Miért nem az arany rozsda? A tudósok a “atomi okfejtést” a nemesfém tartósságát követően észlelik

Miért nem az arany rozsda? A tudósok a “atomi okfejtést” a nemesfém tartósságát követően észlelik

A pézsma elveszti a harcot az OpenAI irányításért, a bíróság igazságot szolgáltat Altman-nek.

A pézsma elveszti a harcot az OpenAI irányításért, a bíróság igazságot szolgáltat Altman-nek.

Mercedes - AMG felfedezte az első négyajtós elektromos páncéltermet

Mercedes - AMG felfedezte az első négyajtós elektromos páncéltermet

Ez a Toyota modell nem felel meg a biztonsági teszteknek.

Ez a Toyota modell nem felel meg a biztonsági teszteknek.

A pilóta robot “mecha” megjelenik a piacon

A pilóta robot “mecha” megjelenik a piacon

Bitcoin esik alá $77.000

Bitcoin esik alá $77.000

Instagram kritizált “Inconditions”

Instagram kritizált “Inconditions”