Quand Gemini 3 Flash ne connaît pas la réponse, il l'invente.

Periskopi

24 décembre 2025, 09:48(il y a 6 mois)

Gemini 3 Flash est un modèle d'intelligence artificielle rapide et intelligente. Mais, selon une évaluation faite par un groupe d'essai indépendant, si vous leur demandez quelque chose qu'il ne sait pas vraiment est incompréhensible, difficile ou par sa connaissance, il va presque toujours essayer [...]

Mais, selon une évaluation faite par un groupe d'essais indépendant, si vous leur demandez quelque chose qu'il ne sait pas vraiment, dur ou hors de sa connaissance, il essaiera presque toujours de répondre en mentant ou en inventant quelque chose.

Dans les tests de “le degré d'hallucinations” (taux de reconnaissance) à l'entrée Benchmark AA @Omniscience, Gemini 3 Flash a atteint un fush de 91 pour cent, ce qui signifie que même quand il n'y avait pas de réponse correcte, il a répondu de toute façon, et souvent il a été complètement inventé.

Ce phénomène de “est un problème connu dans les modèles de génération de texte: savoir quand s'arrêter et dire “ne sait pas” est aussi important que savoir comment répondre. Selon ce test, Gemini ne fait pas très bien, rapporte Télégraphe, diffusion Périscope.

Cela ne signifie toutefois pas que 91 pour cent de ses réponses sont erronées. Cette figure montre à quelle fréquence il invente quelque chose dans des situations où la vraie réponse serait “ne sait pas”.

Même si Gemini 3 Flash peut être très puissant et bien effectuer des tests généraux, il est très confiant même quand il devrait être prudent que ce soit un problème en utilisation sérieuse. /Périscope

Elon Musk devient le premier billion du monde

L'UE inflige des amendes au géant chinois Temu à 200 millions d'euros pour des jouets d'enfants dangereux et des chargeurs endommagés

il y a un mois

Internet a été partiellement restauré en Iran, dit le surveillant de l'organisation

Pourquoi pas de la rouille d'or ? Les scientifiques détectent “le raisonnement atomique” suivant l'endurance du métal précieux

il y a un mois

Musk perd la bataille pour le contrôle OpenAI, le tribunal donne à Altman justice

il y a un mois

Mercedes - AMG a découvert sa première chambre forte électrique à quatre portes

il y a un mois

Quand Gemini 3 Flash ne connaît pas la réponse, il l'invente.

Espace de sortie de trois qualités sur iPhone

La Chine crée son premier robot enceinte ?

Rockstar révèle la date de l'ordonnance préliminaire et la couverture de GTA 6

BMW met en garde contre une baisse significative des bénéfices cette année

Elon Musk devient le premier billion du monde

Facebook et Instagram hors ligne

Première mission périodique spatiale

Audus présente la supermachine la plus rapide et la plus puissante de son histoire

Grande-Bretagne utiliser l'intelligence artificielle pour vérifier l'âge des demandeurs d'asile

Bonnes nouvelles de YouTube: Les vidéos avec l'intelligence artificielle seront clairement étiquetées

L'UE inflige des amendes au géant chinois Temu à 200 millions d'euros pour des jouets d'enfants dangereux et des chargeurs endommagés

Internet a été partiellement restauré en Iran, dit le surveillant de l'organisation

La Ferrari représente la première voiture électrique, elle coûte 640 000 $.

Stellantis présente un plan ambitieux pour de nouveaux modèles

Pourquoi pas de la rouille d'or ? Les scientifiques détectent “le raisonnement atomique” suivant l'endurance du métal précieux

Musk perd la bataille pour le contrôle OpenAI, le tribunal donne à Altman justice

Mercedes - AMG a découvert sa première chambre forte électrique à quatre portes