Wenn Gemini 3 Flash die Antwort nicht kennt, macht er es nur wieder gut.

Gemini 3 Flash ist ein Modell der schnellen und intelligenten künstlichen Intelligenz. Aber nach einer Einschätzung einer unabhängigen Testgruppe, wenn Sie sie etwas fragen, das er nicht wirklich weiß, ist unverständlich, schwierig oder aus seinem Wissen wird er fast immer versuchen, [...]
Aber nach einer Einschätzung einer unabhängigen Testgruppe, wenn Sie sie etwas fragen, was er nicht wirklich weiß, hart oder aus seinem Wissen, wird er fast immer versuchen, zu reagieren, indem er etwas lügt oder erfindet.
In den Tests von “dem Grad der Halluzinationen” (Anerkennungsrate) am Benchmark-Eintrag AA @Omniscience, Gemini 3 Flash erreichte eine 91 Prozent Fush, was bedeutet, dass selbst wenn es keine richtige Antwort gab, antwortete er sowieso, und oft wurde es vollständig erfunden.
Dieses Phänomen von “ist ein bekanntes Problem in Textgenerierungsmustern: zu wissen, wann zu stoppen und zu sagen “weiß nicht” ist so wichtig wie zu wissen, wie zu beantworten. Laut diesem Test macht Gemini das nicht sehr gut, berichtet Telegraph, ausgestrahlt Periskop.
Dies bedeutet jedoch nicht, dass 91 Prozent seiner Antworten falsch sind. Diese Abbildung zeigt nur, wie oft er etwas in Situationen erfindet, in denen die wirkliche Antwort “nicht bekannt ist”.
Obwohl Gemini 3 Flash sehr leistungsstark sein kann und bei allgemeinen Tests gut funktionieren kann, ist er sehr selbstbewusst - selbst wenn er darauf achten sollte, dass es ein Problem im Ernstfall sein kann. /Periskop












