ジェミニ 3 フラッシュが答えを知らないとき、彼はそれをアップさせます。

Gemini 3 Flashは、高速でスマートな人工知能のモデルです。 しかし、独立したテストグループによって作られた評価によると、あなたは彼が本当に知らずに何かを尋ねた場合、彼はほとんど常に試すだろう彼の知識の理解、難しさ、または外です[...]
しかし、独立したテストグループによって作られた評価によると、あなたは彼が本当に彼の知識を知らずに何かを尋ねるならば、彼はほとんど常に何かを嘘や発明することによって反応しようとします。
ベンチマークのエントリーAA @Omniscienceで“の幻覚度”(認知度)のテストでは、Gemini 3 Flashは91パーセントのフラッシュに達しました。これは、正しい答えがなかった場合でも、彼はとにかく答え、そして多くの場合、それは完全に発明されました。
“のこの現象は、テキスト生成パターンの既知の問題です。 “がわからないとき、 ” が答える方法を知ることは重要なことです。 このテストによると、Geminiはこれを非常によくしません、レポート テレグラフ、放送 ペリスコープお問い合わせ
しかし、その答えの91パーセントが間違っているわけではありません。 この図は、実際の答えが“doesn't know” でなければ、状況で何かを発明する頻度を示しています。
ジェミニ 3 フラッシュは非常に強力であり、一般的なテストでうまく実行することができますが、, 彼は非常に自己です - 彼が深刻な使用に問題があるかもしれないことに注意する必要があります。 /ペリスコープ












