ما هو الحث المتخلف؟
يعد الحث العكسي في نظرية اللعبة عملية تكرارية للتفكير بالوراء في الوقت المناسب ، من نهاية المشكلة أو الموقف ، لحل الأشكال الشاملة والألعاب المتسلسلة المحدودة ، واستنتاج سلسلة من الإجراءات المثلى.
شرح الحث الخلفي
تم استخدام الاستقراء الخلفي لحل الألعاب منذ أن أسس جون فون نيومان وأوسكار مورغنسترن نظرية الألعاب كموضوع أكاديمي عندما نشروا كتابهم ، نظرية الألعاب والسلوك الاقتصادي في عام 1944.
في كل مرحلة من مراحل اللعبة ، يحدد الحث المتخلف الإستراتيجية المثلى للاعب الذي يقوم بالخطوة الأخيرة في اللعبة. بعد ذلك ، يتم تحديد الإجراء الأمثل للاعب المتحرك التالي ، مع اتخاذ إجراء اللاعب الأخير كما هو محدد. تستمر هذه العملية للخلف حتى يتم تحديد أفضل إجراء لكل نقطة زمنية. على نحو فعال ، واحد هو تحديد توازن ناش لكل لعبة فرعية للعبة الأصلية.
ومع ذلك ، فإن النتائج المستخلصة من الحث الخلفي غالبا ما تفشل في التنبؤ باللعب البشري الفعلي. أظهرت الدراسات التجريبية أن السلوك "العقلاني" (كما تنبأت به نظرية اللعبة) نادرًا ما يتم عرضه في الحياة الواقعية. قد ينتهي الأمر في الواقع إلى حصول اللاعبين غير العقلانيين على مكافآت أعلى من المتوقع من خلال الحث المتخلف ، كما هو موضح في لعبة حريش.
في لعبة حريش ، يحصل لاعبان بالتناوب على فرصة للحصول على حصة أكبر من الرصيد المتزايد ، أو تمرير الرهان إلى اللاعب الآخر. يتم ترتيب المكافآت بحيث إذا تم تمرير الرهان إلى خصمه وأخذ الخصم الرهان في الجولة التالية ، يتلقى المرء أقل قليلاً مما لو كان المرء قد أخذ الرهان في هذه الجولة. تنتهي اللعبة بمجرد أن يأخذ اللاعب اللعبة ، حيث يحصل ذلك اللاعب على الجزء الأكبر ويحصل اللاعب الآخر على الجزء الأصغر.
مثال على الحث المتخلف
على سبيل المثال ، افترض أن اللاعب A يذهب أولاً ويتعين عليه أن يقرر ما إذا كان يجب عليه أن "يأخذ" أو "يجتاز" اللعبة ، والتي تبلغ حالياً 2 دولار. إذا أخذ ، ثم تحصل A و B على 1 دولار لكل منهما ، ولكن إذا مر A ، يجب أن يتخذ اللاعب ب قرار اتخاذ أو تمرير الآن. إذا أخذ B ، فستحصل على 3 دولارات (أي القيمة السابقة البالغة 2 دولار + 1 دولار) و A يحصل على 0 دولار. ولكن إذا نجحت B ، فيُمكن A الآن أن تقرر ما إذا كنت ستأخذ أم لا ، وما إلى ذلك. إذا اختار اللاعبان دائمًا المرور ، فسيحصل كل منهما على مكافأة قدرها 100 دولار في نهاية اللعبة.
الهدف من اللعبة هو أنه إذا تعاون كل من A و B واستمر في المرور حتى نهاية اللعبة ، فسيحصلان على الحد الأقصى للدفع وهو 100 دولار لكل منهما. لكن إذا كانوا لا يثقون باللاعب الآخر ويتوقعون أن "يغتنموا" الفرصة الأولى ، فإن توازن ناش يتوقع أن يأخذ اللاعبون أقل مطالبة ممكنة (دولار واحد في هذه الحالة).
توازن ناش في هذه اللعبة ، حيث لا يوجد أي لاعب لديه حافز للانحراف عن استراتيجيته المختارة بعد النظر في اختيار الخصم ، يشير إلى أن اللاعب الأول سيأخذ الرهان في الجولة الأولى من اللعبة. ومع ذلك ، في الواقع ، عدد قليل نسبيا من اللاعبين يفعلون ذلك. نتيجة لذلك ، يحصلون على مردود أعلى من المردود الذي توقعه تحليل التوازن.
حل الألعاب المتسلسلة باستخدام الحث الخلفي
أدناه هي لعبة تسلسلية بسيطة بين لاعبين. التسميات التي يتضمنها اللاعب 1 و Player 2 بداخلها هي مجموعات المعلومات للاعبين واحد أو اثنين على التوالي. الأرقام الموجودة بين قوسين في أسفل الشجرة هي المردودات في كل نقطة. اللعبة متسلسلة أيضًا ، لذلك يتخذ اللاعب 1 القرار الأول (يسارًا أو يمينًا) ويتخذ اللاعب 2 قراره بعد اللاعب 1 (أعلى أو لأسفل).
شكل 1
يستخدم الحث العكسي ، مثل كل نظرية اللعبة ، افتراضات العقلانية والتعظيم ، مما يعني أن اللاعب 2 سيضاعف أرباحه في أي موقف معيّن. في أي من مجموعة المعلومات لدينا خياران ، أربعة في الكل. من خلال القضاء على الخيارات التي لن يختارها اللاعب 2 ، يمكننا تضييق نطاق شجرتنا. وبهذه الطريقة ، سنقوم بالخطوط العريضة التي تزيد من عائد اللاعب في مجموعة المعلومات المحددة.
الشكل 2
بعد هذا التخفيض ، يمكن للاعب 1 زيادة أرباحه إلى الحد الأقصى بعد أن أصبحت خيارات اللاعب 2 معروفة. والنتيجة هي عبارة عن توازن يتم العثور عليه عن طريق الحث المتخلف للاعب 1 باختيار "يمين" ثم اختيار لاعب 2 "لأعلى". أدناه هو الحل للعبة مع مسار التوازن الغامق.
الشكل 3
على سبيل المثال ، يمكن للمرء بسهولة إعداد لعبة مشابهة لتلك المذكورة أعلاه باستخدام الشركات كلاعبين. يمكن أن تتضمن هذه اللعبة سيناريوهات إصدار المنتج. إذا أرادت الشركة 1 إصدار منتج ، فما الذي يمكن أن تفعله الشركة 2 استجابة؟ هل ستقوم الشركة 2 بإصدار منتج منافس مماثل؟ من خلال التنبؤ بمبيعات هذا المنتج الجديد في سيناريوهات مختلفة ، يمكننا إعداد لعبة للتنبؤ بكيفية تطور الأحداث. في ما يلي مثال على الطريقة التي يمكن بها للمرء تصميم مثل هذه اللعبة.
الشكل 4