Quand Gemini 3 Flash ne connaît pas la réponse, il l'invente.

Quand Gemini 3 Flash ne connaît pas la réponse, il l'invente.

Gemini 3 Flash est un modèle d'intelligence artificielle rapide et intelligente. Mais, selon une évaluation faite par un groupe d'essai indépendant, si vous leur demandez quelque chose qu'il ne sait pas vraiment est incompréhensible, difficile ou par sa connaissance, il va presque toujours essayer [...]

Mais, selon une évaluation faite par un groupe d'essais indépendant, si vous leur demandez quelque chose qu'il ne sait pas vraiment, dur ou hors de sa connaissance, il essaiera presque toujours de répondre en mentant ou en inventant quelque chose.

Dans les tests de “le degré d'hallucinations” (taux de reconnaissance) à l'entrée Benchmark AA @Omniscience, Gemini 3 Flash a atteint un fush de 91 pour cent, ce qui signifie que même quand il n'y avait pas de réponse correcte, il a répondu de toute façon, et souvent il a été complètement inventé.

Ce phénomène de “est un problème connu dans les modèles de génération de texte: savoir quand s'arrêter et dire “ne sait pas” est aussi important que savoir comment répondre. Selon ce test, Gemini ne fait pas très bien, rapporte Télégraphe, diffusion Périscope.

Cela ne signifie toutefois pas que 91 pour cent de ses réponses sont erronées. Cette figure montre à quelle fréquence il invente quelque chose dans des situations où la vraie réponse serait “ne sait pas”.

Même si Gemini 3 Flash peut être très puissant et bien effectuer des tests généraux, il est très confiant même quand il devrait être prudent que ce soit un problème en utilisation sérieuse. /Périscope

Articles similaires
Elon Musk devient le premier billion du monde

Elon Musk devient le premier billion du monde

Facebook et Instagram hors ligne

Facebook et Instagram hors ligne

Première mission périodique spatiale

Première mission périodique spatiale

Audus présente la supermachine la plus rapide et la plus puissante de son histoire

Audus présente la supermachine la plus rapide et la plus puissante de son histoire

Grande-Bretagne utiliser l'intelligence artificielle pour vérifier l'âge des demandeurs d'asile

Grande-Bretagne utiliser l'intelligence artificielle pour vérifier l'âge des demandeurs d'asile

Bonnes nouvelles de YouTube: Les vidéos avec l'intelligence artificielle seront clairement étiquetées

Bonnes nouvelles de YouTube: Les vidéos avec l'intelligence artificielle seront clairement étiquetées

L'UE inflige des amendes au géant chinois Temu à 200 millions d'euros pour des jouets d'enfants dangereux et des chargeurs endommagés

L'UE inflige des amendes au géant chinois Temu à 200 millions d'euros pour des jouets d'enfants dangereux et des chargeurs endommagés

Internet a été partiellement restauré en Iran, dit le surveillant de l'organisation

Internet a été partiellement restauré en Iran, dit le surveillant de l'organisation

La Ferrari représente la première voiture électrique, elle coûte 640 000 $.

La Ferrari représente la première voiture électrique, elle coûte 640 000 $.

Stellantis présente un plan ambitieux pour de nouveaux modèles

Stellantis présente un plan ambitieux pour de nouveaux modèles

Pourquoi pas de la rouille d'or ? Les scientifiques détectent “le raisonnement atomique” suivant l'endurance du métal précieux

Pourquoi pas de la rouille d'or ? Les scientifiques détectent “le raisonnement atomique” suivant l'endurance du métal précieux

Musk perd la bataille pour le contrôle OpenAI, le tribunal donne à Altman justice

Musk perd la bataille pour le contrôle OpenAI, le tribunal donne à Altman justice

Mercedes - AMG a découvert sa première chambre forte électrique à quatre portes

Mercedes - AMG a découvert sa première chambre forte électrique à quatre portes