ジェミニ 3 フラッシュが答えを知らないとき、彼はそれをアップさせます。

ジェミニ 3 フラッシュが答えを知らないとき、彼はそれをアップさせます。

Gemini 3 Flashは、高速でスマートな人工知能のモデルです。 しかし、独立したテストグループによって作られた評価によると、あなたは彼が本当に知らずに何かを尋ねた場合、彼はほとんど常に試すだろう彼の知識の理解、難しさ、または外です[...]

しかし、独立したテストグループによって作られた評価によると、あなたは彼が本当に彼の知識を知らずに何かを尋ねるならば、彼はほとんど常に何かを嘘や発明することによって反応しようとします。

ベンチマークのエントリーAA @Omniscienceで“の幻覚度”(認知度)のテストでは、Gemini 3 Flashは91パーセントのフラッシュに達しました。これは、正しい答えがなかった場合でも、彼はとにかく答え、そして多くの場合、それは完全に発明されました。

“のこの現象は、テキスト生成パターンの既知の問題です。 “がわからないとき、 ” が答える方法を知ることは重要なことです。 このテストによると、Geminiはこれを非常によくしません、レポート テレグラフ、放送 ペリスコープお問い合わせ

しかし、その答えの91パーセントが間違っているわけではありません。 この図は、実際の答えが“doesn't know” でなければ、状況で何かを発明する頻度を示しています。

ジェミニ 3 フラッシュは非常に強力であり、一般的なテストでうまく実行することができますが、, 彼は非常に自己です - 彼が深刻な使用に問題があるかもしれないことに注意する必要があります。 /ペリスコープ

関連記事
英国は、亡命者の年齢を検証するために人工知能を使用する

英国は、亡命者の年齢を検証するために人工知能を使用する

YouTubeからの朗報:人工知能の動画は明らかにラベル付けされます

YouTubeからの朗報:人工知能の動画は明らかにラベル付けされます

EUは危険な子供のおもちゃや破損した充電器のための200mユーロで中国の巨人テムを罰金を科します

EUは危険な子供のおもちゃや破損した充電器のための200mユーロで中国の巨人テムを罰金を科します

インターネットはIranに部分的に復元され、組織のオーバーセアは言う

インターネットはIranに部分的に復元され、組織のオーバーセアは言う

フェラーリは最初の電気自動車を表し、それは640,000ドルかかります。

フェラーリは最初の電気自動車を表し、それは640,000ドルかかります。

Stellantisは新しいモデルのための野心的な計画を提示します

Stellantisは新しいモデルのための野心的な計画を提示します

なぜ金錆はありませんか? 科学者たちは、貴金属の耐久性に続く“アトミック推論”を検出します

なぜ金錆はありませんか? 科学者たちは、貴金属の耐久性に続く“アトミック推論”を検出します

MuskはOpenAI制御のための戦いを失います、裁判所はAltman正義を与えます

MuskはOpenAI制御のための戦いを失います、裁判所はAltman正義を与えます

メルセデス - AMGは最初の4ドア電動ボルトを発見しました

メルセデス - AMGは最初の4ドア電動ボルトを発見しました

セキュリティテストに失敗したトヨタモデル

セキュリティテストに失敗したトヨタモデル

パイロットロボット “mecha” が市場に登場

パイロットロボット “mecha” が市場に登場

ビットコインは$ 77,000下落

ビットコインは$ 77,000下落

Instagramは“Instances”のために批判しました

Instagramは“Instances”のために批判しました