Kiedy Gemini 3 Flash nie zna odpowiedzi, po prostu to zmyśla.

Kiedy Gemini 3 Flash nie zna odpowiedzi, po prostu to zmyśla.

Gemini 3 Flash to model szybkiej i inteligentnej sztucznej inteligencji. Ale, zgodnie z oceną dokonaną przez niezależną grupę testową, jeśli zapytasz ich coś, czego on naprawdę nie wie jest niezrozumiały, trudne lub poza jego wiedzą będzie prawie zawsze spróbować [...]

Ale, zgodnie z oceną dokonaną przez niezależną grupę testową, jeśli zapytasz ich o coś, o czym on naprawdę nie wie, o czym nie wie, ciężko lub poza jego wiedzą, prawie zawsze będzie próbował zareagować przez kłamstwo lub wynalezienie czegoś.

W testach “stopień halucynacji” (wskaźnik rozpoznawania) w pozycji Benchmark AA @ Omniscience, Gemini 3 Flash osiągnął 91 procent fush, co oznacza, że nawet gdy nie było poprawnej odpowiedzi, odpowiedział i tak, a często to było całkowicie wymyślone.

Ten fenomen “jest znanym problemem w wzorach generowania tekstu: wiedzieć, kiedy przestać i powiedzieć “nie wiedzieć” jest tak ważne, jak wiedzieć, jak odpowiedzieć. Według tego testu, Gemini nie robi tego zbyt dobrze, doniesienia Telegraph, transmisja Peryskop.

Nie oznacza to jednak, że 91% jego odpowiedzi jest błędne. Ta liczba pokazuje, jak często coś wymyśla w sytuacjach, gdy prawdziwa odpowiedź byłaby “nie wie”.

Mimo, że Gemini 3 Flash może być bardzo potężny i dobrze wykonywać testy ogólne, jest bardzo pewny siebie - pewny siebie, nawet jeśli powinien być ostrożny, że może to być problem w poważnym użyciu. /Peryskop

Related
Ferrari reprezentuje pierwszy elektryczny samochód, kosztuje $640 000.

Ferrari reprezentuje pierwszy elektryczny samochód, kosztuje $640 000.

Stellantis przedstawia ambitny plan dla nowych modeli

Stellantis przedstawia ambitny plan dla nowych modeli

Dlaczego nie rdza złota? Naukowcy wykrywają “rozumowanie atomowe” w następstwie wytrzymałości metali szlachetnych

Dlaczego nie rdza złota? Naukowcy wykrywają “rozumowanie atomowe” w następstwie wytrzymałości metali szlachetnych

Piżmo przegrywa bitwę o kontrolę nad OpenAI, sąd daje Altmanowi sprawiedliwość

Piżmo przegrywa bitwę o kontrolę nad OpenAI, sąd daje Altmanowi sprawiedliwość

Mercedes - AMG odkryła swój pierwszy czterodrzwiowy skarbiec elektryczny

Mercedes - AMG odkryła swój pierwszy czterodrzwiowy skarbiec elektryczny

Ten model Toyota nie sprawdza bezpieczeństwa

Ten model Toyota nie sprawdza bezpieczeństwa

Pilot robot “mecha” pojawia się na rynku

Pilot robot “mecha” pojawia się na rynku

Bitcoin spada poniżej $77000

Bitcoin spada poniżej $77000

Instagram krytykowany za “Przypadki”

Instagram krytykowany za “Przypadki”

Pilot robot “mecha” pojawia się na rynku

Pilot robot “mecha” pojawia się na rynku

Po 70 latach Honda oznacza swoją pierwszą roczną stratę

Po 70 latach Honda oznacza swoją pierwszą roczną stratę

Co aplikacja ostrzega użytkowników aktualizacji awaryjnej

Co aplikacja ostrzega użytkowników aktualizacji awaryjnej

Elektryczny Citroen C3 w Niemczech kosztuje tylko 7,990 euro. Jak to możliwe?

Elektryczny Citroen C3 w Niemczech kosztuje tylko 7,990 euro. Jak to możliwe?