שפן על הכביש המהיר

06/08/2007 בשעה 12:19 | פורסם בהספרייה המדעית | סגור לתגובות על שפן על הכביש המהיר
תגים:

בשנת 1955 יצא לאקרנים הסרט 'מרד הנעורים' (Rebel without a cause). אחת הסצנות מתארת בני-עשרה מפונקים מלוס אנג'לס אשר נוהגים במכוניות גנובות לעברו של צוק, ומזנקים מהן החוצה בשניות האחרונות האפשריות. במשחק אימים שכזה ערכו הנערים אחד לאחר מבחן של אומץ. הנער שקופץ ראשון מן המכונית מוכרז פחדן ומפסיד במשחק. לרוע המזל, שרוולו של אחד הנערים נתפס בידית הדלת, והוא צנח יחד עם מכוניתו לתוך האוקיינוס. סצנה זאת ודאי לא היתה זוכה לאזכורים כה מרובים, אילולא נהרג ג'יימס דין בתאונת דרכים, זמן קצר לפני שהסרט שבכיכובו הופץ בבתי הקולנוע.

ארבע שנים אחר כך הוצעה הגרסה המוכרת ביותר של 'משחק השפן' (The Chicken game). הפילוסוף האנגלי ברטראנד ראסל תיאר אותה כך בספרו 'השכל הישר ולוחמה גרעינית': על שני המשתתפים לבחור כביש ישר וארוך, שבאמצעיתו מסומן קו הפרדה לבן. אחר כך עליהם להיכנס לשתי מכוניות מהירות החונות משני קצוות מנוגדים של הכביש, ולהתחיל לדהור זה לעבר זה כשגלגלי צד אחד של כל מכונית חייבים לנסוע על הקו הלבן. כששתי המכוניות עומדות להתנגש זו בזו, הנהג הראשון שסוטה מן הקו הלבן לפני הנהג האחר מוכרז כ"שפן פחדן" ("ארנבון פחדן", מוטב לומר).

את 'משחק השפן' אפשר לתרגם בקלות למשחק מופשט בתורת המשחקים, על פי טבלת התשואות הבאה:

מסיט את המכונית ממשיך ישר קדימה
מסיט את המכונית 2, 2 1, 3
ממשיך ישר קדימה 3, 1 0, 0

(המספרים מייצגים ניקוד שנקבע באופן שרירותי. המספר הימני בכל משבצת הוא התשואה של שחקן השורה. המספר השמאלי הוא התשואה של שחקן הטור)

כפי שניתן להיווכח, התוצאה הגרועה ביותר שיכולה להתרחש, היא כששני היריבים אינם סוטים ממסלולם, ממשיכים ישר קדימה, ונמחצים למוות זה ממכוניתו של זה. תשואתם במקרה שכזה הינה 0. להיות "שפן פחדן" היא התוצאה השנייה הגרועה ביותר. התשואה היא 1, אבל היא עדיפה ממוות. התוצאה של שיתוף פעולה הדדי בין שני היריבים אינה גרועה כל כך. אם שניהם סוטים בו-זמנית ממסלולם, תשואתם היא 2, איש מהם אינו יכול לכנות את האחר בכינוי "שפן", ושניהם גם נותרים בחיים. התוצאה העדיפה ביותר היא להמשיך ישר קדימה, יהא אשר יהא, מתוך ההנחה, שהיריב אינו אמיץ דיו לעשות כן. התשואה במצב שכזה היא 3.

"דילמת השפן" שונה מ'דילמת האסיר' (Prisoner's dilemma). ב"דילמת השפן", התוצאה הגרועה ביותר היא בגידה הדדית. התנהגות שכזאת תביא בהכרח למותם של שני היריבים. לעומת זאת, ב'דילמת האסיר', התוצאה הגרועה ביותר היא להתנהג כפתי ולקוות לשיתוף פעולה הדדי מצד היריב, ואז להיווכח כי הינו בוגד. יתרה מכך, ב'דילמת האסיר' עדיפה הבגידה תמיד, בין אם היריב הוא בוגד בעצמו, ובוודאי בין אם הוא פתי. מדוע?

ניסוח דומה לגרסתה המפורסמת של 'דילמת האסיר' המציא אדגר אלן פו, הידוע כאבי הספרות הבלשית. בעקבות רצח העלמה מרי רוג'רס בשנת 1841, חיבר אלן פו את הסיפור "התעלומה של מארי רוז'ה". אוגוסט דופין, הבלש בסיפור, מדווח כי תינתן חנינה מלאה לחבר כנופיית הפשע, שיתוודה ראשון על רציחתה של מארי רוז'ה. לדעת אלן פו, העובדה שאיש לא נענה להצעה הזאת, מעידה כי הפשע לא נעשה בידי כנופיה אלא בוצע בידי רוצח בודד, כיוון שמעייניו של חבר כנופיה בסיטואציה שכזו היו ממוקדים בחשש מבגידה, ולכן היה מזדרז להתוודות, בטרם יעשה כן חבר אחר בכנופיה.

נניח כי את הרצח ביצעו שני אנשים. לאחר מעשה הרצח, כל אחד מהם נמלט לעיר אחרת מחשש שייתפס. אם שניהם נתפסים על ידי המשטרה, אך אינם מלשינים זה על זה, הם עלולים להיות מורשעים רק על עבירות קודמות ולהישלח לחמש שנות מאסר. כשהידיעה על הכרזת החנינה המלאה מוצאת את אחד מהם בעיר זרה, הוא ניגש מיד לתחנת המשטרה הקרובה, מסגיר את עצמו ומתוודה על פשעו. באותו הזמן ממש עושה כך גם שותפו השני לרצח. כל אחד מהם זכאי לחנינה מלאה, אולם החוק קובע גם כי כשלא ברור מיהו המתוודה הראשון מביניהם, שניהם נשלחים לעשר שנות מאסר באשמת הריגה (ולא רצח). לעומת זאת, אם האחד מתוודה והשני משתהה ונלכד לאחר הוידוי של חברו, תיכף ומהר ימצא את צווארו תלוי בכיכר הכפר. מי שהוכחה אשמתו על ידי עד לפשע דינו מיתה. מטבלת התשואות שלפניכם, ברי מדוע 'שיווי המשקל של נאש' (Nash equilibrium) ב'דילמת האסיר' הוא תמיד בגידה הדדית (אסטרטגיה זאת היא גם יציבה מבחינה אבולוציונית):

מסגיר עצמו ומתוודה (בוגד) נלכד ואינו מודה
מסגיר עצמו ומתוודה (בוגד) 10 שנות מאסר, 10 שנות מאסר חנינה, עונש מוות
נלכד ואינו מודה עונש מוות, חנינה 5 שנות מאסר, 5 שנות מאסר

ב'דילמת האסיר' ישנה דילמה אמיתית. לעומת זאת ב"משחק תיקו" אין כל דילמה. מי שלא מלשין על חברו, ישלח לעשר שנות מאסר בגין עבירות קודמות או יוצא להורג. זה שמלשין על חברו יזכה לחנינה במקרה הטוב, או שיישלח לחמש שנות מאסר בגין הריגה במקרה הרע. על כן 'שיווי המשקל של נאש' ב"משחק תיקו" מחויב להיות בגידה הדדית:

מסגיר עצמו ומתוודה (בוגד) נלכד ואינו מודה
מסגיר עצמו ומתוודה (בוגד) 5 שנות מאסר, 5 שנות מאסר חנינה, עונש מוות
נלכד ואינו מודה עונש מוות, חנינה 10 שנות מאסר, 10 שנות מאסר

'שיווי המשקל של נאש' פותח בעקבות 'משפט המינימקס' (Minimax theorem) של ג'ון פון נוימן. חלוקתה של עוגה לשתי פרוסות היא דוגמה נפוצה לעקרון המינימקס: כשאחד ההורים פורס עוגה לשני חלקים עבור ילדיו, הוא יודע היטב כי תמיד אחד מהם יחוש מקופח, ויטען כי קיבל את הפרוסה הקטנה יותר. בעיית חלוקת העוגה היא קונפליקט בין אינטרסים שונים. שני הילדים רוצים אותו הדבר – חתיכת עוגה גדולה ככל האפשר. אולם, חתיכת עוגה גדולה יותר לאחד, פירושה הקטנת החתיכה של האחר. זהו משחק סכום-אפס, וילד אחד אינו יכול להרוויח דבר מבלי שהילד האחר הפסיד אותו.

על מנת לפתור באופן רציונלי את הבעיה המשפחתית המוכרת כל כך, יש לבקש את אחד הילדים לחתוך את העוגה לשתי פרוסות, ולילד השני יש להעניק את זכות הבחירה הראשונה. כך ניתן להבטיח שהחלוקה תהיה שווה במידה המירבית, כיוון שהילד הפורס את העוגה לא ירצה בפרוסה הקטנה יותר שתישאר למענו. כדברי איטאלו קלווינו, הוא יודע כי המיטב שהוא יכול לצפות לו הוא להימנע מהגרוע ביותר. פיתרון זה אינו תלוי בנדיבותו של הילד הפורס או בחוש הצדק של הילד הבוחר, אלא מוכתב על ידי האינטרס העצמי של שני הילדים כאחד. כך גם ניתן להבטיח שלא תישמענה כל טענות קיפוח. הילד הראשון אינו יכול להלין שהעוגה נחתכה לשני חלקים בלתי שווים, שהרי הוא בעצמו פרס אותה. הילד השני אינו יכול להלין אף הוא, שהרי ניתנה לו זכות הבחירה הראשונה.

'משפט המינימקס' גורס כי תמיד יימצא פיתרון רציונלי לקונפליקט מוגדר, בין שני אנשים שהאינטרסים שלהם מנוגדים לגמרי. מדובר בפיתרון רציונלי מפני ששני הצדדים כאחד מסוגלים לשכנע את עצמם שהם אינם יכולים להשיג משהו טוב יותר, בהתחשב בטבעו של הקונפליקט. הפיתרון הרציונלי למשחק סכום-אפס הוא, לפיכך, שיווי משקל הנכפה על ידי אינטרס עצמי ואי אמון – ואי האמון הוא הגיוני לאור היעדים המנוגדים של היריבים.

ג'ון נאש הרחיב זאת, בהראותו כי גם למשחקי לא-סכום-אפס לשני שחקנים ישנם פתרונות שווי משקל. במשחק זה לא ניתן לצפות כי הרווח של שחקן אחד יהא הפסדו של השחקן האחר, כיוון שבכמה משבצות ישנה תשואה מצורפת גבוהה יותר מאשר במשבצות אחרות:

שורה/טור אסטרטגיה X אסטרטגיה Y
אסטרטגיה X 100, 1 1, 0
אסטרטגיה Y 0, 2 2, 5

במצב 'שיווי משקל של נאש', בוחרים שני השחקנים לפעול על פי אסטרטגיה Y שלהם (משבצת שמאלית תחתונה). שחקן הטור ודאי מרוצה מבחירה זו, הואיל והוא זוכה ב-5 נקודות, שהיא התוצאה הגבוהה ביותר שיכול היה לקוות לה. אולם, גם שחקן השורה אינו יכול להצטער על בחירתו. אילו שחקן הטור היה בוחר באסטרטגיה X, מוטב היה לו לבחור גם כן באסטרטגיה X כי כך היה זוכה ב-100 נקודות, אך אם היה דבק בה, בשעה ששחקן הטור החליט לבחור באסטרטגיה Y, הוא היה זוכה בלא כלום. על כן, בחירתו ובחירת שחקן הטור באסטרטגיה Y מהווה פתרון של שיווי משקל רציונלי.

לפעמים נקודות 'שיווי המשקל של נאש' מובילות לאי-רציונליות במפורש. כך למשל, ב'משחק השפן' ישנם שני מצבי 'שיווי משקל של נאש' (משבצת ימנית למטה ומשבצת שמאלית למעלה). אלה הם המקרים שבהם אחד הנהגים סוטה ממסלולו ויריבו אינו סוטה כלל וממשיך ישר. אליבא דנאש, כל אחת מנקודות שיווי המשקל היא תוצאה רציונלית במידה שווה. ברם, ב'משחק השפן' לא נאכפת הגדרתו של ג'ון נאש כפי שאולי רצה: שני הנהגים יכולים להחליט לנסוע קדימה – על פי הטענה שהדבר עולה בקנה אחד עם הפיתרון הרציונלי, קרי עם 'שיווי המשקל של נאש' – ולהתנגש במכונית הדוהרת מנגד באופן אי-רציונלי!

ל"דילמת השפן" ישנה גם גרסה רבת משתתפים. היא מכונה "דילמת המתנדב": מישהו צריך לבצע מטלה מסוימת שתביא תועלת לכולם. אין זה משנה כלל מי מבצע אותה, אולם הכול סובלים במידה שאף אחד אינו עושה דבר. לדוגמא: מפעל הפיס עורך תחרות נושאת פרסים. פרס אחד הוא בן 100 שקלים. על מנת לזכות בו יש לרכוש כרטיס השתתפות בסך 10 שקלים. פרס שני הוא בן 20 שקלים. על מנת לזכות בו יש לרכוש כרטיס השתתפות בסך 4 שקלים. כל אחד יכול לרכוש כמה כרטיסים שאך ירצה. תנאי הזכייה: הפרסים יינתנו רק אם מספר כרטיסי ההשתתפות עבור הפרס של 20 שקלים, יהיה בשיעור של 80% ומעלה. פחות מכך, כל כספי ההשקעה של המשתתפים ירדו לטמיון.

80% < מבקשים לזכות ב-20 שקל 20% < מבקשים לזכות ב-100 שקל
אדם מבקש לזכות ב-20 שקל 16 שקל, 16 שקל 4- שקל, 10- שקל
אדם מבקש לזכות ב-100 שקל 90 שקל, 16 שקל 10- שקל, 10- שקל

מוטב היה לכולם לרכוש רק את כרטיסי ההשתתפות עבור הפרס של 20 שקלים. כך היתה השקעה של 40 אלף שקלים מניבה רווח של 160 אלף שקלים. אולם, הפיתוי להרוויח תמורת אותה השקעה 360 אלף שקלים, גורם למרבית המשתתפים לרכוש כרטיסים עבור הפרס בן 100 שקלים, וכך כולם מפסידים. לעולם לא יימצאו 80% מתנדבים בתחרות שכזאת!

מילות מפתח: תורת המשחקים, דילמת האסיר, דילמת אסיר, משחק השפן, משחק שפן, משחק תיקו, ספרות בלשית, דילמת המתנדב, דילמת מתנדב, משפט מינימקס, שיווי משקל נאש.

Advertisements

בלוג בוורדפרס.קום.
Entries וכן תגובות feeds.