Όταν ο Gemini 3 Flash δεν ξέρει την απάντηση, απλά την επινοεί.

Gemini 3 Flash είναι ένα μοντέλο της γρήγορης και έξυπνη τεχνητή νοημοσύνη. Αλλά, σύμφωνα με μια αξιολόγηση που γίνεται από μια ανεξάρτητη ομάδα δοκιμών, αν τους ρωτήσετε κάτι που δεν ξέρει πραγματικά είναι ακατανόητη, δύσκολη ή από τη γνώση του θα προσπαθήσει σχεδόν πάντα [...]
Αλλά, σύμφωνα με μια αξιολόγηση που γίνεται από μια ανεξάρτητη ομάδα δοκιμών, αν τους ρωτήσετε κάτι για το οποίο δεν γνωρίζει πραγματικά, σκληρά ή από τη γνώση του, θα προσπαθήσει σχεδόν πάντα να ανταποκριθεί με το ψέμα ή την εφεύρεση κάτι.
Στις εξετάσεις του “ο βαθμός των ψευδαισθήσεων” (ποσοστό αναγνώρισης) στην καταχώρηση του Benchmark AA @Omniscience, το Gemini 3 Flash έφτασε στο 91 τοις εκατό, πράγμα που σημαίνει ότι ακόμα και όταν δεν υπήρχε σωστή απάντηση, απάντησε ούτως ή άλλως, και συχνά ήταν εντελώς επινοημένο.
Αυτό το φαινόμενο του “είναι ένα γνωστό πρόβλημα στα πρότυπα παραγωγής κειμένου: το να ξέρεις πότε να σταματάς και να λες “δεν ξέρει” είναι τόσο σημαντικό όσο το να ξέρεις πώς να απαντήσεις. Σύμφωνα με αυτό το τεστ, οι Δίδυμοι δεν το κάνουν αυτό πολύ καλά, αναφέρει Τηλεγραφία, εκπομπή Περισκόπιο.
Αυτό όμως δεν σημαίνει ότι το 91 τοις εκατό των απαντήσεών του είναι λάθος. Αυτός ο αριθμός δείχνει πόσο συχνά επινοεί κάτι σε καταστάσεις όπου η πραγματική απάντηση θα ήταν “δεν ξέρει”.
Αν και ο Gemini 3 Flash μπορεί να είναι πολύ ισχυρός και να εκτελεί καλά σε γενικές δοκιμές, έχει μεγάλη αυτοπεποίθηση ακόμη και όταν πρέπει να προσέχει ότι μπορεί να είναι πρόβλημα σε σοβαρή χρήση. /Περισκόπιο












