نظريه بازي‌ها

آويناش ديكسيت، بري نالباف
مترجمان: محمدصادق الحسيني، محسن رنجبر
نظريه بازي‌ها علم استراتژي است. اين نظريه تلاش مي‌كند تا اعمالی كه «بازيكن‌ها» در گستره‌اي از «بازي‌ها» بايد انجام دهند تا بهترین پیامد به بار آید را به شکل رياضي و منطقي تعيين كند.

بازی‌هايي كه اين نظريه مورد مطالعه قرار مي‌دهد از شطرنج تا تربيت كودک و از تنيس تا اشتغال كشورها را در برمي‌گيرد. تمام اين بازي‌ها یک ويژگي مشترك دارند و آن نوعی وابستگي دروني است به اين معنا كه نتيجه بازي براي هريك از شركت‌كننده‌ها به انتخاب‌ها (استراتژي‌هاي) همه افراد بستگي دارد. در بازي‌هاي موسوم به بازي با حاصل جمع صفر، منافع بازيكن‌ها به‌طور كامل با يكديگر تعارض پيدا مي‌كند، به‌گونه‌اي كه بهره‌اي كه يك فرد كسب مي‌كند، همواره معادل ضرر فرد ديگر است. شایان ذکر است که بازي‌هايي كه در آنها همه بازیکنان ممکن است به منفعت دست یابند (یعنی بازي‌های با حاصل جمع مثبت) یا ضرر کنند (یعنی بازي‌های با حاصل جمع منفي) معمول‌ترند. در این بازی‌ها درجات مختلفی از تعارض وجود دارد.
جان فون نيومن استاد رياضيات دانشگاه پرنيستون در نظريه بازي‌ها (game theory) پيشگام بود. تمركز اين نظريه در سال‌هاي اول شكل‌گيري آن بر بازي‌هاي داراي تعارض خالص (بازي‌هاي با حاصل جمع صفر) بود. ساير بازي‌ها همکارانه در نظر گرفته می‌شدند، به اين معنا كه شركت‌كنندگان اعمال خود را به اتفاق یکدیگر انتخاب كرده و انجام مي‌دهند. اما در تحقيقات اخير بر بازي‌هايي تمركز گرديده كه نه داراي حاصل جمع صفر هستند و نه به طور خالص همکارانه هستند. در اين بازي‌ها بازيكنان اقدامات خود را به‌صورت جداگانه انتخاب مي‌كنند، اما روابط آنها با یکدیگر حاوي رقابت و همكاري است.
بازي‌ها اساسا با تصميمات اتخاذ شده در یک محيط خنثي متفاوت هستند. براي آنكه اين نكته روشن گردد، تفاوت ميان تصميمات يك چوب‌بر و تصميمات يك ژنرال را در نظر آوريد. زماني كه يك چوب بر تصميمي را درباره چگونگي برش چوب اتخاذ مي‌كند، از چوب انتظار ندارد كه با او مقابله کند، به عبارت دیگر محيطي كه وي در آن به فعاليت مي‌پردازد خنثي است. اما زماني كه يك ژنرال نظامي تصميم مي‌گيرد كه ارتش دشمن را از پا در آورد، بايد مقاومت دشمن را هم پیش‌بینی کرده و طوری تصمیم بگیرد که بتواند بر این مقاومت‌ها غلبه کند. کسی که در یک بازی شرکت می‌کند بايد همانند اين ژنرال ارتباط متقابل خود و ديگر بازیکنان هوشمند و هدفمند را در نظر بگیرد. بازیکنان بايد در تصميمي كه اتخاذ مي‌كنند هم تعارض و هم احتمال همكاري را در نظر داشته باشند. اصل و جوهر هر بازي، وابستگي دروني ميان استراتژي‌هاي بازيكن‌ها است. دو نوع مختلف از ارتباط و وابستگي دروني وجود دارد: وابستگی پیاپی (sequential) و وابستگي همزمان (simultaneous). در نوع پیاپی بازيکن‌ها به ترتيب عمل كرده و هريك، از اقدامات قبلي ديگران آگاهند. در نوع همزمان بازيکنان در يك زمان عمل مي‌كنند و هريك از اقدامات ديگري ناآگاه است. يك اصل عمومي براي بازيکنان شركت‌كننده در بازي با حرکت‌های پیاپی، نگاه به جلو و استدلال عقب‌گرد است. هر بازيکن بايد در نظر بگیرد كه ديگران چگونه به حركت فعلي او واكنش نشان خواهند داد و در مقابل، خودش دست به چه انتخابی خواهد زد. هر بازيكن پيش‌بيني مي‌كند كه تصميمات اوليه او نهايتا به كجا خواهند انجاميد و از اين اطلاعات براي محاسبه بهترين تصميمی که باید اتخاذ کند استفاده مي‌كند. وي زماني كه راجع به چگونگي واكنش ديگران فكر مي‌كند، بايد خود را به جاي آنها قرار داده و همانند آنها فكر كند. او نبايد استدلال خود را به آنها تحميل کند.
در اصل هر بازي پیاپی كه پس از يك سلسله حركات متناهی به پايان برسد را مي‌توان کاملا «حل كرد». در این بازی‌ها بهترين استراتژي هر بازيكن با بررسي تمامي نتايج ممكن تعيين مي‌شود. بازي‌هاي ساده از قبيل دوز را مي‌توان به اين شيوه حل كرد، بنابراين اين‌گونه بازي‌ها چندان چالشی نيستند. اما انجام اين محاسبات براي بسياري از بازي‌هاي ديگر مثل شطرنج بسيار پيچيده است (حتي با كامپيوتر). از اين رو بازيكنان براي چند حركت محدود برنامه‌ريزي مي‌كنند و سعي مي‌کنند که موقعيت‌هاي حاصل را براساس تجربه ارزيابي كنند.
برخلاف بازي‌هاي پیاپی که در آنها زنجيره استدلال خطي است، بازي‌هاي همراه با حركات همزمان يك دور منطقي در خود دارند. اگرچه بازيكن‌ها به صورت همزمان و بدون اطلاع از حركات فعلي يكديگر عمل مي‌كنند، اما همه آنها بايد از اين نكته آگاه باشند كه بازيکنان ديگر عاقلند. طبق اين تفكر هر فرد «فكر مي‌كند كه بازیکن دیگر فكر مي‌كند كه او فكر مي‌كند...» بنابراين هر بازيكن بايد خود را به صورت مجازي به جاي تمامي افراد ديگر قرار دهد و سعي كند پيامد هر حرکت را محاسبه نمايد. بهترين اقدام براي او با توجه به اینگونه محاسبه‌های کلی به دست می‌آید.
اين دور منطقي با استفاده از مفهوم تعادل كه توسط جان نش، رياضيدان دانشگاه پرينستون شكل داده شد به نتیجه می‌رسد (به عبارت دیگر استدلال دوری(circular reasoning) به نتيجه مي‌رسد). ما به دنبال يك مجموعه تصميم (برای همه بازیکنان) هستيم كه در آن، استراتژي فرد براي او بهترين گزينه باشد و بازیکنان دیگر نیز بهترين استراتژي خود را انتخاب کنند. به عبارت ديگر هر بازيكن بهترين واكنش به آنچه ديگران انجام مي‌دهند را انتخاب مي‌کند.برخی اوقات بهترين گزينه براي يك فرد، فارغ از آنكه ديگران چه اقدامي صورت دهند يكسان است. اين حالت را «استراتژي غالب» براي آن بازيكن مي‌نامند. در مواقع ديگر بازيكن با گزينه‌ای روبه‌رو است كه همواره نامناسب است، به اين معنا كه فارغ از آنكه ديگران چه انتخابی کنند، گزینه‌ای وجود دارد که از این گزینه بهتر باشد (به این گزینه «استراتژي مغلوب» گفته می‌شود). جست‌وجو براي يافتن تعادل را بايد با بررسي استراتژي‌های غالب و حذف استراتژی‌هاي مغلوب آغاز كرد. اینکه هر بازیکن بهترین گزینه خود را انتخاب می‌کند به این معنی نیست که تعادل الزاما جایی برقرار می‌شود که از لحاظ اجتماعی بهینه است. در واقع نمونه‌هاي معروفي مثل معماي زنداني (که در ادامه به آن می‌پردازیم) وجود دارند كه در آنها هر بازیکن منافع خود را پیگیری می‌کند، ولی در نهایت نتیجه‌ای که به بار می‌آید نتیجه خوبی نیست. تعريف نش از تعادل راه‌حلي ناقص براي مساله استدلال دوری در بازی‌های داراي حركات همزمان است. در برخي از بازي‌ها چند تعادل نش به دست می‌آید؛ در حالی که در بعضی از بازی‌ها اصلا تعادل نش نداریم. همچنين فرآيند ديناميكي كه مي‌تواند به تعادل منجر شود همچنان نامشخص است. اما اين مفهوم با وجود اين نقايص در تحليل بسياري از تعاملات استراتژيك بسيار كارآمد بوده است. غالبا چنين تصور مي‌شود كه نظريه بازي‌ها همه بازیکنان را عقلایی در نظر می‌گیرد. اما اين نظريه چنين ادعايي ندارد. ممكن است بازيكن‌ها مغرض يا حسود بوده يا خيرخواه و نيكوكار باشند.
اين گفته جورج برناردشاو در اصلاح قانون طلايي را به خاطر داشته باشيد: «با ديگران آن‌گونه که مي‌خواهيد با شما رفتار كنند، رفتار نكنيد. ممكن است سلايق آنها با شما فرق داشته باشد». بازيکنان ديگر ممكن است علاوه‌بر داشتن انگيزه‌هاي متفاوت، اطلاعات مختلفي داشته باشند. هر فرد بايد همواره هنگام محاسبه يك وضعيت تعادلي يا هنگام پيش‌بيني عكس‌العمل‌های دیگر بازیکنان، آنها را همان‌گونه كه هستند و نه آن‌گونه كه خود هست، در نظر آورد. نمونه‌هاي زير از تعامل استراتژيك، برخي از اصول نظريه‌ بازي‌ها را نشان مي‌دهند:
معمای زندانی: دو مظنون به‌طور جداگانه مورد بازجویی قرار مي‌گيرند و هركدام مي‌توانند اعتراف كرده يا ساكت بمانند. در صورتی كه مظنون A سکوت اختیار کند، به نفع مظنون B است که اعتراف کند، چون مجازاتش کاهش می‌یابد. اگر مظنون A اعتراف کند، B نیز بهتر است اعتراف کند تا از شدیدترین مجازات در امان بماند. بنابراین اعتراف کردن، استراتژي غالب فرد B است. همين امر راجع به فرد A نيز صادق است. به همین دلیل تعادل جایی به دست می‌آید که هر دو اعتراف کنند. این در حالی است که اگر هر دو ساكت مي‌ماندند، وضعشان بهتر بود. در صورتی این دو بازیکن همکارانه رفتار می‌کردند (و هر دو سکوت می‌کردند) بازی تکرار می‌شد، زيرا در آن صورت ضرر بلندمدت ناشي از تخطي از همكاري مي‌توانست از منفعت موقت حاصل از تقلب (اعتراف) بیشتر باشد. در چنين شرايطي استراتژي‌هايی مثل مقابله به مثل نیز وجود دارد.
استراتژی‌های مختلط: در برخي شرايط بروز تعارض، رقيب تمامي اقدامات سيستماتيك را كشف كرده و از آنها استفاده خواهد كرد. بنابراين فرد بايد با به هم ريختن حركات خود از اينكه رقيب او بتواند اقداماتش را حدس بزند، ممانعت به عمل آورد. نمونه‌هايي از اين گونه در ورزش مشاهده می‌شود. مثلا اينكه يك بازيكن فوتبال در يك موقعيت خاص پا به توپ شود يا توپ را پاس دهد يا اينكه بازيكن نقش پاسور در واليبال توپ را پاس دهد يا خود آن را روانه زمين حريف كند نمونه‌هایی از گیج کردن حریف به شمار می‌رود. نظريه بازي‌ها اين رفتارها را کمی مي‌كند و نسبت‌هاي صحيح را نشان مي‌دهد.
حركات استراتژيك: هر بازيكن مي‌تواند براي تغيير انتظارات ديگران نسبت به اقدامات آتي خود از تهديد يا وعده استفاده كند و بنابراين آنها را وادار به انجام كارهايي كند كه به نفعش است. البته اين تهديدها و وعده‌ها براي آنكه به موفقيت برسند بايد باورپذیر باشند. اين امر مشكل‌ساز است، زيرا وقتي نوبت به اجراي تهديد يا عمل به وعده مي‌رسد عموما هزينه‌هايي به بار می‌آید. نظريه بازي‌ها، روش‌هاي مختلف براي افزايش باورپذیری را مورد مطالعه قرار مي‌دهد. اصل كلي آن است كه اگر یک بازیکن آزادی اش در انتخاب اقدامات آتی اش را محدود کند، ممکن است منافعش بهتر برآورده شوند. با انجام اين كار اين بازيكن وسوسه این احتمال که وسوسه شود تا زیر قولش بزند یا از تخطی‌های دیگران چشم پوشی کند را از بین می‌برد.
به‌عنوان مثال كورتس (Cortes) هنگام رسیدن به مكزيك همه كشتي‌هاي خود به جز يكي از آنها را غرق كرد. هدف او از اين كار آن بود كه امكان فرار را از بين ببرد. بدون کشتی‌ای که به کار بازگشت به موطن بیاید، کورتس يا بايد در كشورگشايي خود به موفقيت مي‌رسيد يا جان خود را از دست مي‌داد. اگرچه شمار سربازهاي او بسيار کمتر از حریف بود، اما اين تهديد او براي مبارزه تا حد مرگ، روحيه حریفان را تحلیل برد و سربازان دشمن نهایتا تصميم گرفتند عقب‌نشینی کنند. شركت پولارويد نيز زماني كه به نحوی هدفمند عبور از بازار عکس فوری را نپذیرفت، از استراتژي مشابهي استفاده کرد. اين شركت با هر مزاحمي که در اين بازار وارد شده بود به يك مبارزه مرگ و زندگي دست زد. زماني كه كداك به بازار عكس فوري وارد شد، پولارويد تمامي منابع خود را به مبارزه با آن وارد كرد. اين شركت چهارده سال بعد در يك دعوي حقوقي تقريبا
يك ميليارد دلاري عليه كداك به پيروزي رسيد و دوباره به بازار انحصاري خود دست يافت. (البته بعدا و زماني كه شركت پولارويد نتوانست خود را به بازار عكس ديجيتال گسترش دهد، تمركز اين شركت بر محصولات فيلم فوري پرهزينه از آب درآمد). يك راه ديگر براي باورپذیر کردن تهديدات، به كارگيري استراتژي ماجراجويانه لبه پرتگاه (brinkmanship) است (این استراتژی به این معنی است که یک بازیکن عامدانه ریسکی را به وجود آورد که اگر ديگران برخلاف خواسته او عمل کنند، نتیجه حاصله به ضرر همه تمام شود). سیاست لبه پرتگاه كه توسط توماس شلينگ در «استراتژي تعارض» آورده شده است «تاکتیکی است كه در آن به‌طور عامدانه اجازه داده می‌شود که شرايط به نوعي از كنترل خارج شود تنها به اين دليل كه ممكن است چنين حالتي براي طرف مقابل غيرقابل تحمل بوده و او را به انطباق با آن وادار نمايد». زماني كه انبوه اعتراض‌كننده‌ها به مخالفت با دولت‌هاي توتاليتر در چين و اروپاي شرقي مي‌پرداختند، طرفین از این استراتژی استفاده می‌کردند. برخي اوقات يك طرف كوتاه آمده و به شكست خود اعتراف مي‌كند و در مواقع ديگر زماني كه هر دو طرف از لبه پرتگاه سقوط مي‌كنند، يك تراژدي به وجود مي‌آيد.
چانه زنی: در اين حالت دو بازيكن با هم تصميم مي‌گيرند كه چگونه منافع را با يكديگر تقسيم كنند. هريك از طرفین به دنبال سهم بيشتري است و هر دو ترجيح مي‌دهند هرچه زودتر به توافق برسند. زماني كه اين دو به ارائه پيشنهاد مي‌پردازند، اصل نگاه به جلو و استدلال عقبگرد سهم تعادلي هريك را معين مي‌كند. در این حالت توافق در يك زمان حاصل مي‌شود، اما هزينه تاخير بر سهم دو طرف تاثير مي‌گذارد. بازيکنی كه خواهان سرعت بيشتری در رسيدن به توافق باشد، سهم كوچك‌تري را دريافت خواهد كرد.
پنهان‌سازي و افشاي اطلاعات: زماني كه فردي چيزي را مي‌داند كه ديگران از آن بي‌خبرند، برخي اوقات خواهان پنهان‌سازي اين اطلاعات است (مثلا برخی موارد یک طرف می‌خواهد نحوه توليد يك محصول خاص را پنهان کند). در مواقعی نیز بازیکنان مي‌خواهند اين اطلاعات را به طوری که باور‌پذیر باشد افشا کنند (مثلا زمانی که یک شرکت می‌خواهد همه بدانند که به کیفیت محصولاتش اهمیت می‌دهد). در هر دوي اين موارد اصل عمومي اين است كه فايده عمل کردن بیشتر از صحبت کردن است. اگر بخواهيم اطلاعاتي را مخفی کنیم، بايد حركاتمان در هم ريخته باشد. بلوف زدن در بازی‌ها نباید به شکل سیستماتیک صورت بگیرد. گفته وينستون چرچيل درباره مخفي كردن واقعيت ميان «محافظاني از جنس دروغ» را به خاطر داشته باشيد. براي انتقال اطلاعات بايد از اقدامي استفاده كرد كه «پيامی» باورپذیر را انتقال دهد طوری که واضح باشد در صورتی که شرایط طوری نبود که بازیکن ادعا می‌کرد این اقدام به ضررش تمام می‌شد. به‌عنوان مثال ارائه ضمانت طولاني‌مدت پيام معتبري به مصرف‌كننده و مبني بر آن است كه تولیدکننده به اينكه محصول با كيفيت بالايي را به توليد می‌رساند، باور دارد. پيشرفت‌هاي اخير در نظريه بازي‌ها توانسته است استراتژي‌هاي مناسب در شرايط مختلف تضاد و همكاري را توضيح داده و تجویز نمايد، اما هنوز راه زيادي تا كامل شدن اين نظريه باقي است. هنوز هم طراحي يك استراتژي موفقيت‌آميز از جهات زيادي یک هنر به شمار می‌رود.
http://www.donya-e-eqtesad.com/Default_view.asp?@=178955

+ نوشته شده در شنبه بیست و پنجم مهر ۱۳۸۸ ساعت 20:49 توسط |

به وبلاگ دکتر سعید صیاد خوش آمدید

این وبلاگ جهت ارتباط تعاملی دانشجویان مدیریت بویژه رشته مدیریت دولتی با دکتر صیاد طراحی شده است

نظريه بازي‌ها

نوشته‌های پیشین

آرشیو موضوعی