כאשר ג'מיני 3 פלאש לא יודע את התשובה, הוא פשוט ממציא אותה.

כאשר ג'מיני 3 פלאש לא יודע את התשובה, הוא פשוט ממציא אותה.

ג'מיני 3 פלאש הוא מודל של אינטליגנציה מלאכותית מהירה וחכם. אבל, על פי הערכה של קבוצת מבחן עצמאית, אם תשאל אותם משהו שהוא לא באמת יודע הוא בלתי מובן, קשה או מחוץ לידע שלו הוא כמעט תמיד ינסה.

אבל, על פי הערכה של קבוצת מבחן עצמאית, אם תשאל אותם משהו שהוא לא באמת יודע, קשה או מחוץ לידע שלו, הוא כמעט תמיד ינסה להגיב על ידי שקר או להמציא משהו.

במבחנים של “תואר ההזיות” (שיעור ההכרה) ב- Benchmark כניסה AA @Omniscience, Gemini 3 Flash הגיע ל-91 אחוזים fush, כלומר גם כאשר אין תשובה נכונה, הוא ענה בכל מקרה, ולעתים קרובות הוא הומצא לחלוטין.

תופעה זו של “היא בעיה ידועה בדפוסי דור הטקסט: לדעת מתי לעצור ולומר “דוס לא יודע” חשוב כמו לדעת כיצד לענות. לפי מבחן זה, ג'מיני לא עושה את זה טוב מאוד, דוחות טלגרףשידור המונחים.

עם זאת, אין זה אומר ש-91 אחוזים מהתשובות שלו שגויות. דמות זו רק מראה באיזו תדירות הוא ממציא משהו במצבים שבהם התשובה האמיתית תהיה “דוזן לא יודע”.

למרות שג'מיני 3 פלאש יכול להיות חזק מאוד לבצע בדיקות כלליות, הוא מאוד עצמי - בטוח גם כאשר הוא צריך להיות זהיר כי זה יכול להיות בעיה בשימוש רציני.המונחים

Related
בריטניה משתמשת באינטליגנציה מלאכותית כדי לאמת את גיל מבקשי המקלט

בריטניה משתמשת באינטליגנציה מלאכותית כדי לאמת את גיל מבקשי המקלט

חדשות טובות מ- YouTube: קטעי וידאו עם אינטליגנציה מלאכותית יתווספו בבירור

חדשות טובות מ- YouTube: קטעי וידאו עם אינטליגנציה מלאכותית יתווספו בבירור

האיחוד האירופי קנס על ענק סיני Temu ב 200 מיליון יורו עבור צעצועים לילדים מסוכנים

האיחוד האירופי קנס על ענק סיני Temu ב 200 מיליון יורו עבור צעצועים לילדים מסוכנים

האינטרנט שוחזר חלקית לאיראן, אומר מפקח הארגון.

האינטרנט שוחזר חלקית לאיראן, אומר מפקח הארגון.

פרארי מייצגת את המכונית החשמלית הראשונה, היא עולה $640,000.

פרארי מייצגת את המכונית החשמלית הראשונה, היא עולה $640,000.

סטפניטיס מציגה תוכנית שאפתנית למודלים חדשים

סטפניטיס מציגה תוכנית שאפתנית למודלים חדשים

למה זהב לא חלודה? מדענים מזהים “חשיבה אטומית” לאחר הסיבולה של מתכת יקרה

למה זהב לא חלודה? מדענים מזהים “חשיבה אטומית” לאחר הסיבולה של מתכת יקרה

מאסק מאבד את הקרב על בקרת OpenAI, בית המשפט נותן השופט אלטמן

מאסק מאבד את הקרב על בקרת OpenAI, בית המשפט נותן השופט אלטמן

מרצדס - AMG גילה את הקמרון החשמלי הראשון שלה

מרצדס - AMG גילה את הקמרון החשמלי הראשון שלה

דגם טויוטה נכשל בבדיקות אבטחה

דגם טויוטה נכשל בבדיקות אבטחה

רובוט הטייס “mecha” מופיע בשוק

רובוט הטייס “mecha” מופיע בשוק

ביטקוין נופל מתחת ל-77,000

ביטקוין נופל מתחת ל-77,000

Instagram ביקורת על “Instances”

Instagram ביקורת על “Instances”