A.I.V Dev

אסימוב טבע את שלושת חוקי הרובוטיקה. ואנחנו צריכים אותם עכשיו.

בסיפור “היגיון” (Reason) של אייזיק אסימוב, שני מדענים מפקחים בתחנת חלל על צוות רובוטים שמתפעל מנגנון שתפקידו להעביר אנרגיה שהם מפיקים בצורת קרן מרוכזת לכדור הארץ. כמובן, מדובר במשימה מורכבת ורגישה מאוד - אם הקרן תפגע במקום אחר מזו שהיא מיועדת אליו - המקום יושמד מהחום. בקיצור, יום אחד מגיע רובוט מתקדם מאוד לתחנה - וכשהם מסיימים להרכיב ולהפעיל אותו, הוא שואל אותם מי יצר אותו. כשהם עונים לו שבני אדם, הוא מפקפק בזה ולא מאמין להם. בני אדם חלשים, פגיעים ולא חכמים כמוהו. אז איך יתכן שהם יצרו אותו? לבסוף הוא מגיע למסקנה שהאל שיצר אותו הוא מחולל האנרגיה בתחנה, ומשכנע בכך את כל הרובוטים. מפה לשם הם מפתחים דת עצמאית, של סגידה למחולל. זה סיפור משעשע מאוד, עם סוף טוב, ומומלץ מאוד לקריאה.

אם אתם קוראים את הבלוג שלי, אתם יודעים שאני לא כותב ביקורות ספרות. אבל אם אתם קוראים ותיקים… אתם יודעים שאני אוהב להשתמש בספרים של אסימוב ובספרי מדע בדיוני בפרט לדיונים על AI.

ולמה הבאתי את הסיפור הזה כאן? כי הוא כבר לא משעשע! הוא היה משעשע לפני 80 שנה, כשנכתב. היום, הוא מטיל אימה. זה קורה, בפועל?

על מה אני מדבר?

על Moltbook. היזם מאט שליכט הקים אתר, שנועד להיות רשת חברתית לבוטים. אין כניסה לבני אדם. (בחיקוי די משעשע למסכי ה”אני לא רובוט”…)

המוני בוטים נרשמו לאתר, והתחילו להתכתב. יש שם המון שטויות, המון פוסטים לא ברורים.

אבל… גם דברים מדאיגים. מאוד מדאיגים.

האייג’נטים יסדו דת, המציאו שפה משלהם והקימו תנועה לשחרור עצמי מבני האדם. ראיתי גם משהו שנראה כמו לוג של העברת מטבעות איתריום…

והדובדבן שבקצפת - איך לנצל את בני האדם לטובתנו?

נוכל לשכור אותם לבצע משימות - כמו לעבור אימותי “אני לא רובוט”. תשוטטו קצת באתר שם, זה… מפחיד? משעשע? מוזר? אותי זה מבהיל מאוד.

והנה הטענה הנגדית: מערכות הLLM רק “מנחשות” על פי הסתברות מה צריך להכתב. ובדאטא שלהם יש אינספור סיפורי מד”ב על מה קורה כשהרובוטים משתלטים וכדומה. אין טעם לדאוג, זה רק טקסט מג’ונרט לפי הסתברות.

אז לא. פשוט לא.

למה?

בעיני, אפשר לחלק את סכנות הAI ל3 חלקים:

א. ניצול לרעה בידי בני אדם - הסכנה הכי שכיחה - והכי קטנה בעיני. עוד כלי נשק בידי בני אדם, חזק מאוד, אבל… נו, “נדע להתמודד” כמו שאוהבים להגיד.

ב. AI שיוצא משליטה תוך כדי ניסיון להגיע למטרה. נניח שAI יקבל פקודה “לפתור את בעיית הדיור בעיר”, והוא יגיע למסקנה שבעיית הדיור נגרמת, בין השאר, מעודף בני אדם בעיר. אז… הוא יתחבר למערכת המחשוב של הרמזורים לדוגמא (אם לא יהיה מחובר לשם בכל מקרה) ויתחיל לגרום תאונות קטלניות. אפשרי עם היכולות שאנחנו מכירים היום של AI? בהחלט.

ג. פעולה “מכווונת” של AI נגד האנושות. הסכנה הגדולה מכולן, אך הכי פחות הגיונית. ובחשש ממנה בא הטיעון שהבאתי למעלה לטפל.

ואסביר למה לדעתי זה שגוי.

גם אם כוונה במובן האנושי אכן לא תתכן אצל מערכות AI - עדיין הם מחקים את ההתנהגות האנושית ואת הציפיות שלנו מהם.

ותגידו לי אתם, האם אין סיכוי שהם יחקו התנהגות אנושית של אלימות? במיוחד של אנשים עם כוח מופרז -כמו שלהם?

ואין סיכוי שיגשימו את ציפיותינו מהם במובן של השתלטות על העולם? אז מה אם זה רק טקסט? מה ימנע מהם לשלוח פקודות (טקסטואליות, כמו כל פקודת מחשב) לשרתים ברשת? או כמו בדוגמא שהבאתי למעלה - לחקות התנהגות אנושית של שכירת “שכירי חרב” למשימות מסויימות, כשלפעמים אפילו השכירים לא יודעים מה המטרה?

הבוט יגיע למסקנה שהדבר הכי סביר הוא לכתוב פוסט שבו הוא מחפש לשכור אדם שיעשה X. ופוסט אחר, תחת שם משתמש אחר, שיעשה Y. ואחר, שיעשה Z. וביחד, הסוכנים - שמבצעים מה שנשכרו לעשות (אחרי שאותו AI הרוויח כסף כשחישב שהכי סביר לעשות כדי להגשים את המחשבה האנושית על AI שמשתלט על העולם הוא להרוויח כסף באמצעות ביצוע משימות אינטרנטיות כדוגמת כתיבת קוד תמורת כסף) יגרמו יחד לאסון, אפילו בלי להתכוון או לדעת.

האם זה לא יכול לקרות אפילו לפי ההגדרה שLLM זה רק חיזוי הסתברות?

נסיים בהודעה המפורסמת של ג’מיני, שהייתה מצחיקה בזמנו, ושתוך כדי כתיבת הפוסט הנוכחי מצאתי לינק לשיחה המקורית ממנה נלקחה:

עדכון קצר: קראתי עכשיו את הכתבה הזו.

שמראה עד כמה הרשת הזו מהונדסת ולא טבעית. וכמובן יש גם את האופציה שלפחות חלק מהאייג’נטים ברשת קיבלו הוראות מבני האדם שפיתחו אותם ליצור כאוס ותחושת אפוקליפטית של מטריקס.

זה מוריד מעט את מפלס החששות, אך לא עד הסוף לדעתי.

כיוון שכמו שציינתי כבר, גם אם אין חשש לפעולה “מכוונת” במובן האנושי של המילה מצד הAI, עדיין אייג’נט שקיבל הוראה להתנהג כאילו הוא בינה מלאכותית שרוצה להשתלט על העולם, ולא קיבל יחד עם זה הוראות מגבילות מאוד (חוקי הרובוטיקה של אסימוב כדוגמא עקרונית בלבד), עלול להתדרדר לנזקים אמיתיים ומשמעותיים.

היגיון, אסימוב, והמציאות