إن لعبة "مقص ورق الصخور" رائعة لتقرير من سيضطر إلى إخراج القمامة. لكن هل لاحظت ما يحدث عندما تستمر اللعبة ، بدلاً من ثلاث طلقات ، جولة تلو الأخرى؟ أولاً ، تختار مبدأ يمنحك ميزة ، ولكن بعد ذلك يفهمه الخصم بسرعة ويتحول لصالحه. في عملية تغيير الإستراتيجيات ، تصل تدريجيًا إلى نقطة حيث لا يمكن لأي من الجانبين الاستمرار في التحسن. لماذا يحدث هذا؟
في خمسينيات القرن الماضي ، أثبت عالم الرياضيات جون ناش أنه في أي نوع من الألعاب مع عدد محدود من اللاعبين وعدد محدود من الخيارات (مثل "مقص الورق الصخري") ، هناك دائمًا مزيج من الاستراتيجيات التي لا يمكن لأي لاعب إظهار نتائج أفضل فيها بتغيير فقط استراتيجيتك الخاصة. أحدثت نظرية هذه المجموعات المستقرة من الاستراتيجيات ، المسماة "
توازن ناش "
، ثورة في مجال نظرية الألعاب ، وغيرت اتجاه التنمية الاقتصادية وطرق دراسة وتحليل كل شيء من العقود السياسية إلى حركة مرور الشبكة. كما سمحت لناش بالحصول
على جائزة نوبل عام 1994 .
إذن كيف يبدو ميزان ناش في لعبة مقص ورق الصخور؟ دعونا نحاكي موقف تلعب فيه (اللاعب أ) وخصمك (اللاعب ب) اللعبة مرارًا وتكرارًا. في كل جولة ، يكسب الفائز نقطة ، ويخسر الخاسر نقطة ، ويحتسب السحب على أنه صفر نقطة.
افترض أن اللاعب B قد اختار استراتيجية اختيار (غبية) في كل جولة من الورق. بعد بضع جولات من الانتصارات والخسائر والتعادلات ، ستلاحظ على الأرجح نظامه وتضع استراتيجية مضادة ناجحة ، وتختار المقص في كل جولة. دعونا نسمي هذه المجموعة من الاستراتيجيات (مقص ، ورقة). إذا أسفرت كل جولة عن مقص على الورق ، فسوف تمهد طريقك لتحقيق نصر مثالي.
لكن اللاعب B سرعان ما يلاحظ البصيرة لهذه المجموعة من الاستراتيجيات. عندما يرى أنك تختار المقص ، يتحول إلى استراتيجية لاختيار الحجر باستمرار. تبدأ هذه المجموعة من الإستراتيجيات (المقص ، الحجر) بالفوز للاعب B. ولكن ، بالطبع ، ستذهب الآن إلى الورق. خلال هذه المراحل من اللعبة ، يستخدم اللاعبون A و B ما يسمى استراتيجيات "نظيفة" - وهي الإستراتيجيات الوحيدة التي يتم اختيارها وتنفيذها باستمرار.
من الواضح أنه لا يمكن تحقيق التوازن هنا: لكل استراتيجية نقية ، على سبيل المثال ، "اختر دائمًا حجرًا" ، يمكنك تطوير استراتيجية مضادة ، على سبيل المثال ، "اختر دائمًا ورقة" ، مما سيجعلك تغير الاستراتيجية مرة أخرى. ستقوم أنت وخصمك بمتابعة بعضكما البعض باستمرار في دائرة الاستراتيجيات.
ولكن يمكنك أيضًا تجربة استراتيجية "مختلطة". افترض أنه بدلاً من اختيار إستراتيجية واحدة ، يمكنك تحديد إحدى الإستراتيجيات الخالصة عشوائيًا في كل جولة. بدلاً من "اختيار حجر دائمًا" ، قد تبدو الاستراتيجية المختلطة مثل "في نصف الحالات اختر حجرًا ، وفي النصف الآخر اختر مقصًا". أثبت ناش أنه عندما تكون مثل هذه الاستراتيجيات المختلطة مقبولة ، يجب أن يكون هناك نقطة توازن واحدة على الأقل في كل لعبة من هذا القبيل. دعنا نجدها.
ما هي الإستراتيجية المختلطة المعقولة لـ "مقص الورق الصخري"؟ يبدو من المنطقي أنه من "اختيار الحجر أو الورق أو المقص باحتمال متساوٍ". مثل هذه الاستراتيجية مكتوبة
. هذا يعني أنه من المحتمل أن يتم اختيار الحجر والمقص والورق
. هل هذه الاستراتيجية جيدة؟
افترض أن استراتيجية خصمك هي "اختر حجرًا دائمًا". هذه إستراتيجية خالصة ، يمكن وصفها بأنها
. ماذا ستكون نتائج اللعبة عند توظيف الاستراتيجيات
للاعب A و
للاعب B؟
للحصول على صورة أوضح للعبة ، سنقوم ببناء طاولة تظهر فيها احتمالات كل من النتائج التسع المحتملة لكل جولة: حجر في A ، حجر في B ؛ حجر في A ، ورقة في B ؛ وهكذا دواليك. في الجدول أدناه ، يشير الصف العلوي إلى تحديد Player B ، ويشير العمود الأيسر إلى تحديد Player A.
أ | ب | إلى | ب | ن |
إلى | | 0 | 0 |
ب | | 0 | 0 |
ن | | 0 | 0 |
يشير كل عنصر من عناصر الجدول إلى احتمال وجود زوج من الخيارات المحددة لكل جولة. إنه ببساطة نتاج الاحتمالات أن يقوم كل لاعب بالاختيار المناسب. على سبيل المثال ، احتمال أن يختار اللاعب "الورق" يساوي
، واحتمال أن يختار اللاعب B حجرًا هو 1 ، أي أن الاحتمال (حجر عند A ، حجر عند B) هو
. لكن الاحتمال (ورقة في A ، مقص في B) متساوي
، لأن احتمال انتقاء مقص اللاعب B هو صفر.
كيف سيثبت اللاعب أ نفسه في مجموعة استراتيجياته؟ سيفوز اللاعب أ بثلث الوقت (الورق والحجر) ، ويخسر ثلث الوقت (المقص والحجر) وثلث الوقت بالتعادل (الحجر والحجر). يمكننا حساب عدد النقاط التي سيحصل عليها اللاعب أ في المتوسط في كل جولة عن طريق حساب مجموع منتج كل نتيجة بالاحتمال المقابل:
وبالتالي ، في المتوسط ، سيحصل اللاعب A على 0 نقطة لكل جولة. سوف تفوز ، تخسر وتعادل باحتمالية متساوية. في المتوسط ، سيوازن عدد المكاسب والخسائر مع بعضها البعض ، وفي الواقع ، سيتعادل كلا اللاعبين.
لكن كما قلنا بالفعل ، يمكنك تحسين نتائجك بتغيير استراتيجيتك ، بافتراض أن العدو لن يغير استراتيجيته. إذا ذهبت إلى الإستراتيجية (0،1،0) ("اختر الورق في كل مرة") ، فسيبدو جدول الاحتمالات كما يلي:
في كل جولة ، ستلف حجر الخصم في الورقة وتحصل على نقطة واحدة في كل جولة.
هذا هو زوج من الاستراتيجيات -
لـ A و
بالنسبة لـ B ، إنه ليس توازن ناش: يمكنك ، كلاعب A ، تحسين نتائجك من خلال تغيير استراتيجيتك.
كما رأينا ، لا يبدو أن الاستراتيجيات النقية تؤدي إلى التوازن. ولكن ماذا لو حاول خصمك استخدام إستراتيجية مختلطة ، على سبيل المثال
؟؟؟ هذه هي الاستراتيجية "في نصف الحالات ، اختر حجرًا ؛ الورق والمقص يحصلان على ربع الحالات. " إليك ما سيبدو عليه جدول الاحتمالات:
أ | ب | إلى | ب | ن |
إلى | | | |
ب | | | |
ن | | | |
وهنا جدول "المكافآت" من وجهة نظر اللاعب "أ" ؛ هذا هو عدد النقاط التي حصل عليها اللاعب أ في كل نتيجة.
أ | ب | إلى | ب | ن |
إلى | 0 | -1 | 1 |
ب | 1 | 0 | -1 |
ن | -1 | 1 | 0 |
باستخدام الضرب ، نقوم بدمج الجدولين لحساب متوسط عدد النقاط التي حصل عليها اللاعب أ لكل جولة.
في المتوسط ، يكسب اللاعب A مرة أخرى 0 نقطة لكل جولة. كما كان من قبل ، هذه المجموعة من الاستراتيجيات ،
لـ A و
بالنسبة لـ B ، مما أدى إلى التعادل.
ولكن كما كان من قبل ، يمكنك ، كلاعب A ، تحسين نتائجك عن طريق تغيير الإستراتيجية: ضد إستراتيجية اللاعب B
يتعين على اللاعب "أ" الاختيار
. هذا هو جدول الاحتمالات:
أ | ب | إلى | ب | ن |
إلى | | | |
ب | | | |
ن | | | |
وهذه هي النتيجة النهائية لـ A:
أي أن هذه المجموعة من الاستراتيجيات -
لـ A و
for B - يعطي متوسط اللاعب A حسب
نقاط لكل جولة. بعد 100 مباراة ، سيتقدم اللاعب أ بفارق 6.25 نقطة. اللاعب أ لديه حافز كبير لتغيير الاستراتيجية. هذه مجموعة من الاستراتيجيات
لـ A و
لأن B ليس أيضًا توازن ناش.
ولكن الآن دعونا نلقي نظرة على بضع استراتيجيات
لـ A و
بالنسبة إلى B. فيما يلي جدول الاحتمالات المقابل:
أ | ب | إلى | ب | ن |
إلى | | | |
ب | | | |
ن | | | |
بفضل التناظر ، يمكننا حساب النتيجة الإجمالية بسرعة:
ومرة أخرى ، توصلت أنت وخصمك إلى التعادل. لكن الفرق هنا هو أنه ليس لدى أي من اللاعبين حافز لتغيير الاستراتيجيات! إذا ذهب اللاعب B إلى أي استراتيجية غير متوازنة ، حيث تم اختيار خيار واحد - لنقل ، حجر - أكثر من غيره ، فسيقوم اللاعب أ ببساطة بتغيير استراتيجيته واختيار الورق في كثير من الأحيان. في النهاية ، سيؤدي ذلك إلى نتيجة إجمالية إيجابية للاعب A في كل جولة. هذا هو بالضبط ما يحدث عندما يختار اللاعب A إستراتيجية
ضد استراتيجية اللاعب ب
.
بالطبع ، إذا انتقل اللاعب "أ"
إلى إستراتيجية غير متوازنة ، سيتمكن اللاعب B أيضًا من الاستفادة. لذلك ، لا يمكن لأي من اللاعبين تحسين نتائجهم إلا بتغيير إستراتيجيتهم. وصلت المباراة إلى رصيد ناش.
أثبتها ناش ، حقيقة أن هذه الألعاب لها توازن متماثل مهم جدًا لعدة أسباب. أحد الأسباب هو أنه يمكن تصميم العديد من المواقف من الحياة الواقعية على أنها ألعاب. عندما تضطر مجموعة من الأشخاص إلى الاختيار بين المنافع الشخصية والجماعية - على سبيل المثال ، في المفاوضات أو في عملية التنافس على الموارد المشتركة - يمكنك رؤية استخدام الاستراتيجيات وتقييم المكاسب. كان لعمل ناش تأثير كبير ، ويرجع الفضل في ذلك جزئيًا إلى الطبيعة المنتشرة لهذا النموذج الرياضي.
سبب آخر هو أن توازن ناش ، إلى حد ما ، هو نتيجة إيجابية لجميع اللاعبين. عندما يتم الوصول إلى هذا التوازن ، لا يمكن لأي من اللاعبين تحسين نتائجهم عن طريق تغيير استراتيجيتهم. قد تكون هناك نتائج جماعية يمكن تحقيقها عندما يتصرف جميع اللاعبين بتعاون مثالي ، ولكن إذا كان بإمكانك فقط التحكم في نفسك ، فإن توازن ناش سيكون أفضل النتائج التي يمكنك تحقيقها.
لذلك ، يمكن للمرء أن يأمل في أن تؤدي "الألعاب" مثل حزم الحوافز الاقتصادية ، ورموز الضرائب ، وشروط العقد ، وتصميمات الشبكة إلى توازن ناش حيث سيخرج الأفراد الذين يعملون لمصلحتهم بنتيجة تناسب الجميع والأنظمة تصبح مستقرة. ولكن عند لعب هذه الألعاب ، هل من المعقول افتراض أن اللاعبين يأتون بشكل طبيعي إلى توازن ناش؟
هناك إغراء للاعتقاد بذلك. في لعبتنا "مقص الورق الصخري" يمكننا أن نخمن على الفور أنه لا يمكن لأي لاعب أن يلعب بشكل أفضل ، إلا من خلال اللعب بالصدفة. لكن هذا يحدث جزئيًا لأن تفضيلات جميع اللاعبين معروفة لجميع اللاعبين الآخرين: الجميع يعرف كم سيفوز بعضهم البعض ويخسرون مع كل من النتائج. ولكن ماذا لو كانت التفضيلات أكثر إخفاء وتعقيدًا؟
تخيل لعبة جديدة يحصل فيها اللاعب B على ثلاث نقاط عندما يفوز على المقص ، ونقطة واحدة لأي فوز آخر. سيؤدي هذا إلى تغيير الإستراتيجية المختلطة: غالبًا ما يختار اللاعب B الحجر ، على أمل الحصول على مكافأة ثلاثية عندما يختار اللاعب A المقص. وعلى الرغم من أن الفرق في النقاط لا يؤثر بشكل مباشر على مكافآت اللاعب A ، فإن التغيير الناتج في استراتيجية اللاعب B سيؤدي إلى استراتيجية مضادة جديدة A.
وإذا كانت كل من مكافآت اللاعب B مختلفة ومخفية ، فإن اللاعب A سيحتاج إلى بعض الوقت لمعرفة استراتيجية اللاعب B. يجب أن يكون هناك العديد من الجولات قبل تخمين اللاعب A ، دعنا نقول عدد المرات التي يختار فيها اللاعب B حجرًا لفهمه كم مرة يحتاج إلى اختيار الورق.
تخيل الآن أن 100 شخص يلعبون مقص الورق الصخري ، ولكل منهم مجموعة مختلفة من المكافآت السرية ، يعتمد كل منها على عدد خصومه الـ 99 الذين يفوزون به بالحجر أو المقص أو الورق. كم من الوقت سيستغرق لحساب التردد الصحيح لاختيار الحجر أو المقص أو الورق المطلوب للوصول إلى نقطة التوازن؟ على الأرجح ، الكثير. ربما أكثر من اللعبة نفسها ستستمر. ربما أطول من عمر الكون نفسه!
على الأقل ، ليس من الواضح على الإطلاق أنه حتى اللاعبين العقلانيين والمدروسين تمامًا الذين يختارون استراتيجيات جيدة ويتصرفون من أجل مصلحتهم الخاصة سيصلون إلى توازن في اللعبة نتيجة لذلك. تكمن هذه الفكرة في
مقال نشر عبر الإنترنت في عام 2016 . يثبت أنه لا يوجد حل عام يمكن أن يؤدي في جميع الألعاب إلى توازن ناش تقريبي على الأقل. هذا لا يعني أن اللاعبين المثاليين لا يكافحون أبدًا لتحقيق التوازن في الألعاب - غالبًا ما يكافحون حقًا. هذا يعني فقط أنه لا يوجد سبب للاعتقاد أنه إذا لعب لاعبون مثاليون اللعبة ، فسيتم تحقيق التوازن.
عندما نطور شبكة نقل ، يمكننا أن نأمل أن يصل جميع اللاعبين ، أي السائقين والمشاة ، الذين يسعى كل منهم للعثور على أسرع طريق إلى الوطن ، بشكل جماعي إلى توازن لا يمكن فيه الفوز بأي شيء عن طريق اختيار طريق مختلف. يمكننا أن نأمل أن اليد الخفية لجون ناش ستوجههم بطريقة تجعل مصالحهم التنافسية والمشتركة - اختيار أقصر طريق ممكن مع تجنب الاختناقات المرورية - ستخلق التوازن.
لكن لعبة قص الورق الصخري ذات التعقيد المتزايد تظهر أن مثل هذه الآمال قد لا تتحقق. قد تتحكم اليد غير المرئية في بعض هذه الألعاب ، لكن الألعاب الأخرى تقاومها ، مما يجذب اللاعبين إلى فخ المنافسة التي لا نهاية لها للفوز الذي يصعب الوصول إليه باستمرار.
تمارين
- قل أن اللاعب B يلعب باستراتيجية مختلطة . ما هي الاستراتيجية المختلطة التي يجب أن يختارها A لزيادة حجم أرباحه على المدى الطويل؟
- قل أن اللاعب B يلعب باستراتيجية مختلطة . ما هي الاستراتيجية المختلطة التي يجب أن يختارها A لزيادة حجم أرباحه على المدى الطويل؟
- كيف يمكن أن تتغير ديناميكيات اللعبة إذا حصل كل لاعب على نقطة التعادل؟