Wenn Gemini 3 Flash die Antwort nicht kennt, macht er es nur wieder gut.

Wenn Gemini 3 Flash die Antwort nicht kennt, macht er es nur wieder gut.

Gemini 3 Flash ist ein Modell der schnellen und intelligenten künstlichen Intelligenz. Aber nach einer Einschätzung einer unabhängigen Testgruppe, wenn Sie sie etwas fragen, das er nicht wirklich weiß, ist unverständlich, schwierig oder aus seinem Wissen wird er fast immer versuchen, [...]

Aber nach einer Einschätzung einer unabhängigen Testgruppe, wenn Sie sie etwas fragen, was er nicht wirklich weiß, hart oder aus seinem Wissen, wird er fast immer versuchen, zu reagieren, indem er etwas lügt oder erfindet.

In den Tests von “dem Grad der Halluzinationen” (Anerkennungsrate) am Benchmark-Eintrag AA @Omniscience, Gemini 3 Flash erreichte eine 91 Prozent Fush, was bedeutet, dass selbst wenn es keine richtige Antwort gab, antwortete er sowieso, und oft wurde es vollständig erfunden.

Dieses Phänomen von “ist ein bekanntes Problem in Textgenerierungsmustern: zu wissen, wann zu stoppen und zu sagen “weiß nicht” ist so wichtig wie zu wissen, wie zu beantworten. Laut diesem Test macht Gemini das nicht sehr gut, berichtet Telegraph, ausgestrahlt Periskop.

Dies bedeutet jedoch nicht, dass 91 Prozent seiner Antworten falsch sind. Diese Abbildung zeigt nur, wie oft er etwas in Situationen erfindet, in denen die wirkliche Antwort “nicht bekannt ist”.

Obwohl Gemini 3 Flash sehr leistungsstark sein kann und bei allgemeinen Tests gut funktionieren kann, ist er sehr selbstbewusst - selbst wenn er darauf achten sollte, dass es ein Problem im Ernstfall sein kann. /Periskop

Ähnliche Artikel
Elon Musk wird die erste Billion der Welt

Elon Musk wird die erste Billion der Welt

Facebook und Instagram offline

Facebook und Instagram offline

Die erste Weltraum-Periodische Mission

Die erste Weltraum-Periodische Mission

Audus präsentiert die schnellste und leistungsfähigste Supermaschine seiner Geschichte

Audus präsentiert die schnellste und leistungsfähigste Supermaschine seiner Geschichte

Großbritannien verwendet künstliche Intelligenz, um das Alter der Asylbewerber zu überprüfen

Großbritannien verwendet künstliche Intelligenz, um das Alter der Asylbewerber zu überprüfen

Gute Nachrichten von YouTube: Videos mit künstlicher Intelligenz werden deutlich gekennzeichnet

Gute Nachrichten von YouTube: Videos mit künstlicher Intelligenz werden deutlich gekennzeichnet

EU-Feingeld Chinesischer Riese Temu bei 200 Millionen Euro für gefährliche Kinderspielzeuge und beschädigte Ladegeräte

EU-Feingeld Chinesischer Riese Temu bei 200 Millionen Euro für gefährliche Kinderspielzeuge und beschädigte Ladegeräte

Das Internet wurde teilweise in den Iran wiederhergestellt, sagt Organisationsleiter

Das Internet wurde teilweise in den Iran wiederhergestellt, sagt Organisationsleiter

Der Ferrari repräsentiert das erste Elektroauto, er kostet $640,000.

Der Ferrari repräsentiert das erste Elektroauto, er kostet $640,000.

Stellantis präsentiert ehrgeizigen Plan für neue Modelle

Stellantis präsentiert ehrgeizigen Plan für neue Modelle

Warum rostet Gold nicht? Wissenschaftler erkennen “atomische Argumentation” nach der Ausdauer von Edelmetall

Warum rostet Gold nicht? Wissenschaftler erkennen “atomische Argumentation” nach der Ausdauer von Edelmetall

Musk verliert Kampf für OpenAI Kontrolle, Gericht gibt Altman Gerechtigkeit

Musk verliert Kampf für OpenAI Kontrolle, Gericht gibt Altman Gerechtigkeit

Mercedes - AMG entdeckte seinen ersten viertürigen elektrischen Tresor

Mercedes - AMG entdeckte seinen ersten viertürigen elektrischen Tresor