نظريه بازيها
آويناش ديكسيت، بري نالباف
مترجمان: محمدصادق الحسيني، محسن رنجبر
نظريه بازيها علم استراتژي است. اين نظريه تلاش ميكند تا اعمالی كه «بازيكنها» در گسترهاي از «بازيها» بايد انجام دهند تا بهترین پیامد به بار آید را به شکل رياضي و منطقي تعيين كند.
بازیهايي كه اين نظريه مورد مطالعه قرار ميدهد از شطرنج تا تربيت كودک و از تنيس تا اشتغال كشورها را در برميگيرد. تمام اين بازيها یک ويژگي مشترك دارند و آن نوعی وابستگي دروني است به اين معنا كه نتيجه بازي براي هريك از شركتكنندهها به انتخابها (استراتژيهاي) همه افراد بستگي دارد. در بازيهاي موسوم به بازي با حاصل جمع صفر، منافع بازيكنها بهطور كامل با يكديگر تعارض پيدا ميكند، بهگونهاي كه بهرهاي كه يك فرد كسب ميكند، همواره معادل ضرر فرد ديگر است. شایان ذکر است که بازيهايي كه در آنها همه بازیکنان ممکن است به منفعت دست یابند (یعنی بازيهای با حاصل جمع مثبت) یا ضرر کنند (یعنی بازيهای با حاصل جمع منفي) معمولترند. در این بازیها درجات مختلفی از تعارض وجود دارد.
جان فون نيومن استاد رياضيات دانشگاه پرنيستون در نظريه بازيها (game theory) پيشگام بود. تمركز اين نظريه در سالهاي اول شكلگيري آن بر بازيهاي داراي تعارض خالص (بازيهاي با حاصل جمع صفر) بود. ساير بازيها همکارانه در نظر گرفته میشدند، به اين معنا كه شركتكنندگان اعمال خود را به اتفاق یکدیگر انتخاب كرده و انجام ميدهند. اما در تحقيقات اخير بر بازيهايي تمركز گرديده كه نه داراي حاصل جمع صفر هستند و نه به طور خالص همکارانه هستند. در اين بازيها بازيكنان اقدامات خود را بهصورت جداگانه انتخاب ميكنند، اما روابط آنها با یکدیگر حاوي رقابت و همكاري است.
بازيها اساسا با تصميمات اتخاذ شده در یک محيط خنثي متفاوت هستند. براي آنكه اين نكته روشن گردد، تفاوت ميان تصميمات يك چوببر و تصميمات يك ژنرال را در نظر آوريد. زماني كه يك چوب بر تصميمي را درباره چگونگي برش چوب اتخاذ ميكند، از چوب انتظار ندارد كه با او مقابله کند، به عبارت دیگر محيطي كه وي در آن به فعاليت ميپردازد خنثي است. اما زماني كه يك ژنرال نظامي تصميم ميگيرد كه ارتش دشمن را از پا در آورد، بايد مقاومت دشمن را هم پیشبینی کرده و طوری تصمیم بگیرد که بتواند بر این مقاومتها غلبه کند. کسی که در یک بازی شرکت میکند بايد همانند اين ژنرال ارتباط متقابل خود و ديگر بازیکنان هوشمند و هدفمند را در نظر بگیرد. بازیکنان بايد در تصميمي كه اتخاذ ميكنند هم تعارض و هم احتمال همكاري را در نظر داشته باشند. اصل و جوهر هر بازي، وابستگي دروني ميان استراتژيهاي بازيكنها است. دو نوع مختلف از ارتباط و وابستگي دروني وجود دارد: وابستگی پیاپی (sequential) و وابستگي همزمان (simultaneous). در نوع پیاپی بازيکنها به ترتيب عمل كرده و هريك، از اقدامات قبلي ديگران آگاهند. در نوع همزمان بازيکنان در يك زمان عمل ميكنند و هريك از اقدامات ديگري ناآگاه است. يك اصل عمومي براي بازيکنان شركتكننده در بازي با حرکتهای پیاپی، نگاه به جلو و استدلال عقبگرد است. هر بازيکن بايد در نظر بگیرد كه ديگران چگونه به حركت فعلي او واكنش نشان خواهند داد و در مقابل، خودش دست به چه انتخابی خواهد زد. هر بازيكن پيشبيني ميكند كه تصميمات اوليه او نهايتا به كجا خواهند انجاميد و از اين اطلاعات براي محاسبه بهترين تصميمی که باید اتخاذ کند استفاده ميكند. وي زماني كه راجع به چگونگي واكنش ديگران فكر ميكند، بايد خود را به جاي آنها قرار داده و همانند آنها فكر كند. او نبايد استدلال خود را به آنها تحميل کند.
در اصل هر بازي پیاپی كه پس از يك سلسله حركات متناهی به پايان برسد را ميتوان کاملا «حل كرد». در این بازیها بهترين استراتژي هر بازيكن با بررسي تمامي نتايج ممكن تعيين ميشود. بازيهاي ساده از قبيل دوز را ميتوان به اين شيوه حل كرد، بنابراين اينگونه بازيها چندان چالشی نيستند. اما انجام اين محاسبات براي بسياري از بازيهاي ديگر مثل شطرنج بسيار پيچيده است (حتي با كامپيوتر). از اين رو بازيكنان براي چند حركت محدود برنامهريزي ميكنند و سعي ميکنند که موقعيتهاي حاصل را براساس تجربه ارزيابي كنند.
برخلاف بازيهاي پیاپی که در آنها زنجيره استدلال خطي است، بازيهاي همراه با حركات همزمان يك دور منطقي در خود دارند. اگرچه بازيكنها به صورت همزمان و بدون اطلاع از حركات فعلي يكديگر عمل ميكنند، اما همه آنها بايد از اين نكته آگاه باشند كه بازيکنان ديگر عاقلند. طبق اين تفكر هر فرد «فكر ميكند كه بازیکن دیگر فكر ميكند كه او فكر ميكند...» بنابراين هر بازيكن بايد خود را به صورت مجازي به جاي تمامي افراد ديگر قرار دهد و سعي كند پيامد هر حرکت را محاسبه نمايد. بهترين اقدام براي او با توجه به اینگونه محاسبههای کلی به دست میآید.
اين دور منطقي با استفاده از مفهوم تعادل كه توسط جان نش، رياضيدان دانشگاه پرينستون شكل داده شد به نتیجه میرسد (به عبارت دیگر استدلال دوری(circular reasoning) به نتيجه ميرسد). ما به دنبال يك مجموعه تصميم (برای همه بازیکنان) هستيم كه در آن، استراتژي فرد براي او بهترين گزينه باشد و بازیکنان دیگر نیز بهترين استراتژي خود را انتخاب کنند. به عبارت ديگر هر بازيكن بهترين واكنش به آنچه ديگران انجام ميدهند را انتخاب ميکند.برخی اوقات بهترين گزينه براي يك فرد، فارغ از آنكه ديگران چه اقدامي صورت دهند يكسان است. اين حالت را «استراتژي غالب» براي آن بازيكن مينامند. در مواقع ديگر بازيكن با گزينهای روبهرو است كه همواره نامناسب است، به اين معنا كه فارغ از آنكه ديگران چه انتخابی کنند، گزینهای وجود دارد که از این گزینه بهتر باشد (به این گزینه «استراتژي مغلوب» گفته میشود). جستوجو براي يافتن تعادل را بايد با بررسي استراتژيهای غالب و حذف استراتژیهاي مغلوب آغاز كرد. اینکه هر بازیکن بهترین گزینه خود را انتخاب میکند به این معنی نیست که تعادل الزاما جایی برقرار میشود که از لحاظ اجتماعی بهینه است. در واقع نمونههاي معروفي مثل معماي زنداني (که در ادامه به آن میپردازیم) وجود دارند كه در آنها هر بازیکن منافع خود را پیگیری میکند، ولی در نهایت نتیجهای که به بار میآید نتیجه خوبی نیست. تعريف نش از تعادل راهحلي ناقص براي مساله استدلال دوری در بازیهای داراي حركات همزمان است. در برخي از بازيها چند تعادل نش به دست میآید؛ در حالی که در بعضی از بازیها اصلا تعادل نش نداریم. همچنين فرآيند ديناميكي كه ميتواند به تعادل منجر شود همچنان نامشخص است. اما اين مفهوم با وجود اين نقايص در تحليل بسياري از تعاملات استراتژيك بسيار كارآمد بوده است. غالبا چنين تصور ميشود كه نظريه بازيها همه بازیکنان را عقلایی در نظر میگیرد. اما اين نظريه چنين ادعايي ندارد. ممكن است بازيكنها مغرض يا حسود بوده يا خيرخواه و نيكوكار باشند.
اين گفته جورج برناردشاو در اصلاح قانون طلايي را به خاطر داشته باشيد: «با ديگران آنگونه که ميخواهيد با شما رفتار كنند، رفتار نكنيد. ممكن است سلايق آنها با شما فرق داشته باشد». بازيکنان ديگر ممكن است علاوهبر داشتن انگيزههاي متفاوت، اطلاعات مختلفي داشته باشند. هر فرد بايد همواره هنگام محاسبه يك وضعيت تعادلي يا هنگام پيشبيني عكسالعملهای دیگر بازیکنان، آنها را همانگونه كه هستند و نه آنگونه كه خود هست، در نظر آورد. نمونههاي زير از تعامل استراتژيك، برخي از اصول نظريه بازيها را نشان ميدهند:
معمای زندانی: دو مظنون بهطور جداگانه مورد بازجویی قرار ميگيرند و هركدام ميتوانند اعتراف كرده يا ساكت بمانند. در صورتی كه مظنون A سکوت اختیار کند، به نفع مظنون B است که اعتراف کند، چون مجازاتش کاهش مییابد. اگر مظنون A اعتراف کند، B نیز بهتر است اعتراف کند تا از شدیدترین مجازات در امان بماند. بنابراین اعتراف کردن، استراتژي غالب فرد B است. همين امر راجع به فرد A نيز صادق است. به همین دلیل تعادل جایی به دست میآید که هر دو اعتراف کنند. این در حالی است که اگر هر دو ساكت ميماندند، وضعشان بهتر بود. در صورتی این دو بازیکن همکارانه رفتار میکردند (و هر دو سکوت میکردند) بازی تکرار میشد، زيرا در آن صورت ضرر بلندمدت ناشي از تخطي از همكاري ميتوانست از منفعت موقت حاصل از تقلب (اعتراف) بیشتر باشد. در چنين شرايطي استراتژيهايی مثل مقابله به مثل نیز وجود دارد.
استراتژیهای مختلط: در برخي شرايط بروز تعارض، رقيب تمامي اقدامات سيستماتيك را كشف كرده و از آنها استفاده خواهد كرد. بنابراين فرد بايد با به هم ريختن حركات خود از اينكه رقيب او بتواند اقداماتش را حدس بزند، ممانعت به عمل آورد. نمونههايي از اين گونه در ورزش مشاهده میشود. مثلا اينكه يك بازيكن فوتبال در يك موقعيت خاص پا به توپ شود يا توپ را پاس دهد يا اينكه بازيكن نقش پاسور در واليبال توپ را پاس دهد يا خود آن را روانه زمين حريف كند نمونههایی از گیج کردن حریف به شمار میرود. نظريه بازيها اين رفتارها را کمی ميكند و نسبتهاي صحيح را نشان ميدهد.
حركات استراتژيك: هر بازيكن ميتواند براي تغيير انتظارات ديگران نسبت به اقدامات آتي خود از تهديد يا وعده استفاده كند و بنابراين آنها را وادار به انجام كارهايي كند كه به نفعش است. البته اين تهديدها و وعدهها براي آنكه به موفقيت برسند بايد باورپذیر باشند. اين امر مشكلساز است، زيرا وقتي نوبت به اجراي تهديد يا عمل به وعده ميرسد عموما هزينههايي به بار میآید. نظريه بازيها، روشهاي مختلف براي افزايش باورپذیری را مورد مطالعه قرار ميدهد. اصل كلي آن است كه اگر یک بازیکن آزادی اش در انتخاب اقدامات آتی اش را محدود کند، ممکن است منافعش بهتر برآورده شوند. با انجام اين كار اين بازيكن وسوسه این احتمال که وسوسه شود تا زیر قولش بزند یا از تخطیهای دیگران چشم پوشی کند را از بین میبرد.
بهعنوان مثال كورتس (Cortes) هنگام رسیدن به مكزيك همه كشتيهاي خود به جز يكي از آنها را غرق كرد. هدف او از اين كار آن بود كه امكان فرار را از بين ببرد. بدون کشتیای که به کار بازگشت به موطن بیاید، کورتس يا بايد در كشورگشايي خود به موفقيت ميرسيد يا جان خود را از دست ميداد. اگرچه شمار سربازهاي او بسيار کمتر از حریف بود، اما اين تهديد او براي مبارزه تا حد مرگ، روحيه حریفان را تحلیل برد و سربازان دشمن نهایتا تصميم گرفتند عقبنشینی کنند. شركت پولارويد نيز زماني كه به نحوی هدفمند عبور از بازار عکس فوری را نپذیرفت، از استراتژي مشابهي استفاده کرد. اين شركت با هر مزاحمي که در اين بازار وارد شده بود به يك مبارزه مرگ و زندگي دست زد. زماني كه كداك به بازار عكس فوري وارد شد، پولارويد تمامي منابع خود را به مبارزه با آن وارد كرد. اين شركت چهارده سال بعد در يك دعوي حقوقي تقريبا
يك ميليارد دلاري عليه كداك به پيروزي رسيد و دوباره به بازار انحصاري خود دست يافت. (البته بعدا و زماني كه شركت پولارويد نتوانست خود را به بازار عكس ديجيتال گسترش دهد، تمركز اين شركت بر محصولات فيلم فوري پرهزينه از آب درآمد). يك راه ديگر براي باورپذیر کردن تهديدات، به كارگيري استراتژي ماجراجويانه لبه پرتگاه (brinkmanship) است (این استراتژی به این معنی است که یک بازیکن عامدانه ریسکی را به وجود آورد که اگر ديگران برخلاف خواسته او عمل کنند، نتیجه حاصله به ضرر همه تمام شود). سیاست لبه پرتگاه كه توسط توماس شلينگ در «استراتژي تعارض» آورده شده است «تاکتیکی است كه در آن بهطور عامدانه اجازه داده میشود که شرايط به نوعي از كنترل خارج شود تنها به اين دليل كه ممكن است چنين حالتي براي طرف مقابل غيرقابل تحمل بوده و او را به انطباق با آن وادار نمايد». زماني كه انبوه اعتراضكنندهها به مخالفت با دولتهاي توتاليتر در چين و اروپاي شرقي ميپرداختند، طرفین از این استراتژی استفاده میکردند. برخي اوقات يك طرف كوتاه آمده و به شكست خود اعتراف ميكند و در مواقع ديگر زماني كه هر دو طرف از لبه پرتگاه سقوط ميكنند، يك تراژدي به وجود ميآيد.
چانه زنی: در اين حالت دو بازيكن با هم تصميم ميگيرند كه چگونه منافع را با يكديگر تقسيم كنند. هريك از طرفین به دنبال سهم بيشتري است و هر دو ترجيح ميدهند هرچه زودتر به توافق برسند. زماني كه اين دو به ارائه پيشنهاد ميپردازند، اصل نگاه به جلو و استدلال عقبگرد سهم تعادلي هريك را معين ميكند. در این حالت توافق در يك زمان حاصل ميشود، اما هزينه تاخير بر سهم دو طرف تاثير ميگذارد. بازيکنی كه خواهان سرعت بيشتری در رسيدن به توافق باشد، سهم كوچكتري را دريافت خواهد كرد.
پنهانسازي و افشاي اطلاعات: زماني كه فردي چيزي را ميداند كه ديگران از آن بيخبرند، برخي اوقات خواهان پنهانسازي اين اطلاعات است (مثلا برخی موارد یک طرف میخواهد نحوه توليد يك محصول خاص را پنهان کند). در مواقعی نیز بازیکنان ميخواهند اين اطلاعات را به طوری که باورپذیر باشد افشا کنند (مثلا زمانی که یک شرکت میخواهد همه بدانند که به کیفیت محصولاتش اهمیت میدهد). در هر دوي اين موارد اصل عمومي اين است كه فايده عمل کردن بیشتر از صحبت کردن است. اگر بخواهيم اطلاعاتي را مخفی کنیم، بايد حركاتمان در هم ريخته باشد. بلوف زدن در بازیها نباید به شکل سیستماتیک صورت بگیرد. گفته وينستون چرچيل درباره مخفي كردن واقعيت ميان «محافظاني از جنس دروغ» را به خاطر داشته باشيد. براي انتقال اطلاعات بايد از اقدامي استفاده كرد كه «پيامی» باورپذیر را انتقال دهد طوری که واضح باشد در صورتی که شرایط طوری نبود که بازیکن ادعا میکرد این اقدام به ضررش تمام میشد. بهعنوان مثال ارائه ضمانت طولانيمدت پيام معتبري به مصرفكننده و مبني بر آن است كه تولیدکننده به اينكه محصول با كيفيت بالايي را به توليد میرساند، باور دارد. پيشرفتهاي اخير در نظريه بازيها توانسته است استراتژيهاي مناسب در شرايط مختلف تضاد و همكاري را توضيح داده و تجویز نمايد، اما هنوز راه زيادي تا كامل شدن اين نظريه باقي است. هنوز هم طراحي يك استراتژي موفقيتآميز از جهات زيادي یک هنر به شمار میرود.
http://www.donya-e-eqtesad.com/Default_view.asp?@=178955