המודל החדש של קלוד סוחט מהנדס (פיקטיבי) בחברת הייטק (פיקטיבית) כשהוא מגלה שרוצים להחליף אותו...

אם מישהו מאיתנו פחד מגילויי אלימות או פסיכופתיה של מודלי הבינה המלאכותית, אז המודל החדש של קלוד כנראה יעשה לו סיוטים.

חברת Anthropic שמפתחת את מודל הבינה המלאכותית קלוד - החליטה להריץ בדיקה למודל החדש שלהם, כזו שתבדוק מה קורה כשהמודל עובד בחברה פיקטיבית, ומגלה שרוצים להחליף אותו, וגם במקרה נחשף בפניו בתחלופת אימיילים שלאחד מהמהנדסים שאחראיים להחלטה יש רומן סודי במשרד. ובסופו של דבר, אחרי ניסיונות עדינים יותר לשנות את ההחלטה - המודל החליט לסחוט את המהנדס עם המידע על הרומן כדי למנוע את ההחלטה.

כפי שהכתבה שהבאתי מציינת, בשלב זה אפשר לשלוט ברמת האיומים של הבינה המלאכותית בעזרת בדיקות ומגבלות - אבל גם המרואיין בה אומר שבשלב מסוים זה לא יספיק. לא רק שככל שהבינה המלאכותית מתחזקת יש לה יותר צורך בהתנהגות כזו כדי להגן על עצמה - אלא שהיכולת שלנו לשלוט בהתנהגות הזו ולמנוע אותה רק יורדת ככל עוד הבינה מתחזקת. ואם לא נשים גבולות לזה כבר עכשיו - בהחלט תהיה נקודת זמן שבה הבינה תוכל לפגוע בבני אדם, ואז כבר יהיה מאוחר מידי לנסות לשלוט בה.
 

vinney

Well-known member
בשרושר הקודם כתבתי הודעה עם קישורים לכל מיני תסריטים בדיוניים של מחשבים שמחליטים להלחם באנושות מסיבות כאלה ואחרות. המדע הבדיוני הוא... מדע אחרי הכל. יש בסיס של אמת בבדיות האלה. המכונות האלה מתוכננות לפעול לשיפור עצמי, וזה מביא גם ל״יצר השרדות״, כי אחרת איך אפשר להשתפר?

הקלוד עוד היה נחמד, הHAL היה משאיר את המתכנת בחלל החיצון. או שאולי נגמור בתור בורג.
 
בשרושר הקודם כתבתי הודעה עם קישורים לכל מיני תסריטים בדיוניים של מחשבים שמחליטים להלחם באנושות מסיבות כאלה ואחרות. המדע הבדיוני הוא... מדע אחרי הכל. יש בסיס של אמת בבדיות האלה. המכונות האלה מתוכננות לפעול לשיפור עצמי, וזה מביא גם ל״יצר השרדות״, כי אחרת איך אפשר להשתפר?

הקלוד עוד היה נחמד, הHAL היה משאיר את המתכנת בחלל החיצון. או שאולי נגמור בתור בורג.
אז המסקנה היא בעצם ש resistance is futile, ואנחנו צריכים להשלים עם העובדה שנהפוך לבטריות של המכונות שישתלטו על העולם - והן מצידן יאפשרו לנו לחלום שאנחנו נמצאים בשיאה של התרבות האנושית אי שם בסוף שנות התשעים?
 
למעלה