Quan el Gemini 3 no coneix la resposta, ho aconsegueix.

El Gemini 3 Flash és un model d'intel·ligència artificial ràpida i intel·ligent. Però, d'acord amb una avaluació feta per un grup de proves independent, si els pregunteu quelcom que realment no sap és incomprensible, difícil o fora del seu coneixement, gairebé sempre provarà [...]
Però, d'acord amb una avaluació feta per un grup de proves independent, si els pregunteu quelcom que realment no sap, difícil o fora del seu coneixement, gairebé sempre intentarà respondre per mentir o inventar alguna cosa.
En les proves de “el grau de les al·lucinacions” (recognició) a l'entrada de Benchmark AA @Omniscience, el 3 Gemini va assolir un f1 per cent, que vol dir que fins i tot quan no hi havia resposta correcta, va respondre de totes maneres, i sovint es va inventar completament.
Aquest fenomen de “és un problema conegut en patrons de generació de text: saber quan aturar i dir “no sap que” és tan important com saber com respondre. Segons aquesta prova, els Bessons no ho fan gaire bé, informes Telegraph, difusió Periscope.
Això no vol dir que el 91 per cent de les seves respostes estiguin equivocades. Aquesta figura mostra la freqüència que inventa alguna cosa en situacions quan la resposta real seria “no coneix”.
Tot i que el Gemini 3 Flash pot ser molt poderós i dur a terme en proves generals, és molt segur fins i tot quan hauria d'anar amb compte que podria ser un problema seriós. /Periscope











