博弈論與納什均衡

上傳人：風(fēng)*** IP屬地：貴州上傳時(shí)間：2023-05-15 格式：DOC 頁(yè)數(shù)：13 大?。?7.50KB 積分：7.2 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩8頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論與納什均衡博弈論與納什均衡《博弈論與納什均衡理論》姓名張賀祺學(xué)號(hào)2023010404專業(yè)政治經(jīng)濟(jì)學(xué)指導(dǎo)老師張秉云摘要博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題，具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法，也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為，并研究它們的優(yōu)化策略。納什均衡指的是這樣一種戰(zhàn)略組合，這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下，沒(méi)有人有足夠理由打破這種均衡。納什均衡，從實(shí)質(zhì)上說(shuō)，是一種非合作博弈狀態(tài)。關(guān)鍵字：博弈論；納什均衡；合作博弈；非合作博弈目錄摘要(2)關(guān)鍵字(2)一、引言(4)二、博弈論與納什均衡的主要內(nèi)容(4)（一）博弈論的主要思想(4)（二）博弈論的分類(5)三、經(jīng)典案例(7)（一）博弈論的經(jīng)典案例(7)（二）納什均衡經(jīng)典案例(7)四、博弈論和納什均衡的重要影響(8)（一）博弈論的重要影響(8)（二）納什均衡的重要影響(8)參考文獻(xiàn)(9)博弈論與納什均衡理論一、引言近代對(duì)于博弈論的研究，開(kāi)始于策墨咯（Zermelo），波雷爾（Borel）及馮·諾伊曼（vonNeumann）。1928年，馮·諾依曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮·諾依曼和摩根斯坦共著的劃時(shí)代巨著《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟(jì)領(lǐng)域，從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950～1951年，約翰·福布斯·納什（JohnForbesNashJr）利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在，為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。納什的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》（1950），《非合作博弈》（1951）等等，給出了納什均衡的概念和均衡存在定理。此外，塞爾頓、哈桑尼的研究也對(duì)博弈論發(fā)展起到推動(dòng)作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。博弈論（GameTheory）:亦名“對(duì)策論”、“賽局理論”，屬應(yīng)用數(shù)學(xué)的一個(gè)分支，主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題，具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為，并研究它們的優(yōu)化策略。納什均衡：（Nashequilibrium）又稱為非合作博弈均衡，是博弈論的一個(gè)重要術(shù)語(yǔ)，以約翰·納什命名。假設(shè)有n人局中人參與博弈，給定其他人策略的條件下，每個(gè)局中人選擇自己的最優(yōu)策略（個(gè)人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略），從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合（StrategyProfile）。納什均衡指的是這樣一種戰(zhàn)略組合，這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下，沒(méi)有人有足夠理由打破這種均衡。納什均衡，從實(shí)質(zhì)上說(shuō)，是一種非合作博弈狀態(tài)。二、博弈論與納什均衡的主要內(nèi)容（一）博弈論的主要思想一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容：第一，博弈的參加者，即博弈過(guò)程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織；第二，博弈信息，即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料；第三，博弈方可選擇的全部行為或策略的集合；第四，博弈的次序，即博弈參加者做出策略選擇的先后；第五，博弈方的收益，即各博弈方做出決策選擇后的所得和所失。博弈論模型可以用五個(gè)方面來(lái)描述:G={P,AS,I,U)P：為局中人，博弈的參與者，也稱為博弈方，局中人是能夠獨(dú)立決策，獨(dú)立承擔(dān)責(zé)任的個(gè)人或組織，局中人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。決策人：在博弈中率先做出決策的一方，這一方往往依據(jù)自身的感受、經(jīng)驗(yàn)和表面狀態(tài)優(yōu)先采取一種有方向性的行動(dòng)。對(duì)抗者：在博弈二人對(duì)局中行動(dòng)滯后的那個(gè)人，與決策人要做出基本反面的決定，并且他的動(dòng)作是滯后的、默認(rèn)的、被動(dòng)的，但最終占優(yōu)。他的策略可能依賴于決策人劣勢(shì)的策略選擇，因此對(duì)抗是唯一占優(yōu)的方式，實(shí)為領(lǐng)導(dǎo)人的階段性終結(jié)行為。局中人（players）：在一場(chǎng)競(jìng)賽或博弈中，每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人。只有兩個(gè)局中人的博弈現(xiàn)象稱為兩人博弈，而多于兩個(gè)局中人的博弈稱為多人博弈。A：為各局中人的所有可能的策略或行動(dòng)的集合。根據(jù)該集合是有限還是無(wú)限，可分為有限博弈和無(wú)限博弈，后者表現(xiàn)為連續(xù)對(duì)策、重復(fù)博弈和微分對(duì)策等。策略(strategy)：一局博弈中，每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案，即方案不是某階段的行動(dòng)方案，而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案，一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案，稱為這個(gè)局中人的一個(gè)策略。如果在一個(gè)博弈中局中人都總共有有限個(gè)策略，則稱為“有限博弈”，否則稱為“無(wú)限博弈”。S:博弈的進(jìn)程：也是博弈進(jìn)行的次序、局中人同時(shí)行動(dòng)的一次性決策的博弈，稱為靜態(tài)博弈；局中人行動(dòng)有先后次序，稱為動(dòng)態(tài)博弈。I:博弈信息，能夠影響最后博弈結(jié)局的所有局中人的情報(bào)。信息在博弈中占重要的地位，博弈的贏得很大程度上依賴于信息的準(zhǔn)確度與多寡。得益信息是博弈中的重要信息，如果博弈各方對(duì)各種局勢(shì)下所有局中人的得益狀況完全清楚，稱之為完全信息博弈。反之為不完全信息博弈。在動(dòng)態(tài)博弈中還有一類信息：輪到行動(dòng)的博弈方是否完全了解此前對(duì)方的行動(dòng)。如果完全了解則稱之為具有完美信息的博弈。反之稱為不完美信息的動(dòng)態(tài)博弈。由于信息不完美，博弈的結(jié)果只能是概率期望,而不能像完美信息博弈那樣有確定的結(jié)果。U:為局中人獲得利益，也是博弈各方追求的最終目標(biāo)。根據(jù)各方得益的不同情況，分為零和博弈與變和博弈。零和博弈中各方利益之間是完全對(duì)立的。變和博弈有可能存在合作關(guān)系，爭(zhēng)取雙贏的局面。得失(payoffs)：一局博弈結(jié)局時(shí)的結(jié)果稱為得失。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失，不僅與該局中人自身所選擇的策略有關(guān)，而且與全局中人所取定的一組策略有關(guān)。所以，一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù)，通常稱為支付（payoff）函數(shù)。次序（orders）：各博弈方的決策有先后之分，且一個(gè)博弈方要作不止一次的決策選擇，就出現(xiàn)了次序問(wèn)題；其他要素相同次序不同，博弈就不同。（二）博弈論的分類博弈模型一般分為合作博弈（cooperativegame）和非合作博弈（non-cooperativegame），如圖1.1。合作博弈是以單個(gè)參與者的可能行動(dòng)集合為基本元素，而非合作博弈是以參與人群的可能聯(lián)合行動(dòng)集合為基本元素（MartinJ.OsborneandArielRubinstein，2000，P2），也就是說(shuō)，在合作博弈中，博弈中所有參與者都獨(dú)立行動(dòng)，不存在有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系，而在非合作博弈中，在一些參與者之間存在著有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系，并因?yàn)檫@種關(guān)系影響到博弈的結(jié)局。合作博弈強(qiáng)調(diào)的是團(tuán)體理性（collectiverationality）、效率、公正和公平；非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策，其結(jié)果可能是有效率的，也可能是低效率或無(wú)效率的（張維迎，1996，P5）。20世紀(jì)50年代，合作博弈的研究達(dá)到鼎盛期，同時(shí)開(kāi)始出現(xiàn)對(duì)非合作博弈的研究，此后，博弈論的研究主流逐步轉(zhuǎn)向在非合作博弈領(lǐng)域。有些人認(rèn)為非合作博弈模型比合作博弈更“基本”，但有些人認(rèn)為兩者不相上下（MartinJ.OsborneandArielRubinstein，2000，P2）。合作博弈，有時(shí)也叫做聯(lián)盟博弈（coalitionalgame），一般根據(jù)有無(wú)轉(zhuǎn)移支付而分為兩類：可轉(zhuǎn)移支付聯(lián)盟博弈（coalitionalgamewithtransferablepayoff）和不可轉(zhuǎn)移支付聯(lián)盟博弈（coalitionalgamewithnon-transferablepayoff）?？赊D(zhuǎn)移支付也叫有旁支付（sidepayment），可轉(zhuǎn)移支付聯(lián)盟博弈假設(shè)博弈中各參與者都用相同的尺度來(lái)衡量他們的贏得，且各聯(lián)盟的贏得可以按任意方式在聯(lián)盟成員中分?jǐn)?；否則，就是不可轉(zhuǎn)移支付聯(lián)盟博弈。非合作博弈的分類主要從兩個(gè)角度進(jìn)行劃分。一是參與者的行動(dòng)順序。從這個(gè)角度博弈可以分為靜態(tài)博弈（staticgame）和動(dòng)態(tài)博弈（dynamicgame）。靜態(tài)博弈是指參與者同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知前行動(dòng)者采取了何種行動(dòng)；動(dòng)態(tài)博弈是指參與者的行動(dòng)有先后順序且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。二是參與者掌握的信息水平。從這個(gè)角度，博弈可以分為完全信息博弈和不完全信息博弈。完全信息（completeinformation）指的是每一個(gè)參與者對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí)；否則就是不完全信息（incompleteinformation）。圖1.1博弈的分類綜合上述兩種分類方法，可將非合作博弈分成四類。這四類博弈及其對(duì)應(yīng)的均衡概念，大致上反映了20世紀(jì)50年代以來(lái)非合作博弈理論的主要進(jìn)展和1994年三位諾貝爾經(jīng)濟(jì)學(xué)將得主的主要貢獻(xiàn)，同時(shí)也大致表明了“納什均衡”及其精煉在博弈論發(fā)展中的地位和影響（如表2.1）。表2.1非合作博弈的分類及對(duì)應(yīng)的均衡概念、主要貢獻(xiàn)者三、經(jīng)典案例（一）博弈論的經(jīng)典案例智豬博弈（Pigs’payoffs）講的是：豬圈里有兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有個(gè)踏板，每踩一下踏板，在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會(huì)落下少量的食物。如果有一只豬去踩踏板，另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)小豬踩動(dòng)踏板時(shí)，大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物；若是大豬踩動(dòng)了踏板，則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽，爭(zhēng)吃到另一半殘羹。那么，兩只豬各會(huì)采取什么策略？答案是：小豬將選擇“搭便車”策略，也就是舒舒服服地等在食槽邊；而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在？因?yàn)椋∝i踩踏板將一無(wú)所獲，不踩踏板反而能吃上食物。對(duì)小豬而言，無(wú)論大豬是否踩動(dòng)踏板，不踩踏板總是好的選擇。反觀大豬，已明知小豬是不會(huì)去踩動(dòng)踏板的，自己親自去踩踏板總比不踩強(qiáng)吧，所以只好親力親為了。槍手博弈：王者的悲哀。三人對(duì)槍自決，甲乙丙槍法優(yōu)劣遞減。最后無(wú)奈而神奇的結(jié)局，將不取決于同時(shí)開(kāi)槍還是先后開(kāi)槍，最優(yōu)良的槍手，倒下的概率將最高；而最蹩腳的槍手，存活的希望卻最大。因?yàn)闆](méi)有人會(huì)把威脅最小的槍手列為一號(hào)清楚目標(biāo)。在這里，后發(fā)制人的弱勢(shì)者將勝出。以弱勝?gòu)?qiáng)，絕不是神話。（二）納什均衡經(jīng)典案例和的革命，非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營(yíng)銷和政治科學(xué)等學(xué)科中，現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?！奔{什均衡的重要影響可以概括為以下六個(gè)方面：（1）改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等，均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域，改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu)，成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具，從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。（2）擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法，因而不能進(jìn)行微觀層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法，包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法，為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。（3）加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用，不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理，分析問(wèn)題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律，強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問(wèn)題的根源，因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問(wèn)題。（4）形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問(wèn)題或經(jīng)濟(jì)關(guān)系，按照經(jīng)典博弈的類型或特征進(jìn)行分類，并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究，將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。（5）擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大，就因?yàn)樗胀ǎ移胀ǖ綆缀鯚o(wú)處不在。納什均衡理論既適用于人類的行為規(guī)律，也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用，使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密，形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。（6）改變了經(jīng)濟(jì)學(xué)的語(yǔ)言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利（Kandori，1997）對(duì)保羅·薩繆爾森（PaulSamuelson）的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家，因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞，那就是‘供給’和‘需求’”，曾做過(guò)一個(gè)幽默的引申，他說(shuō)，“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞，那就是‘納什均衡’”。參考文獻(xiàn)[1]李伯聰，李軍.關(guān)于囚徒困境的幾個(gè)問(wèn)題[J].自然辯證法通訊,2023,(04)[2]丁華,周洋,韓雪峰.“囚徒困境”的引申與啟示[J].職業(yè)時(shí)空,2023,(01)[3]馬立強(qiáng).囚徒困境與納什均衡[J].科學(xué)大眾(中學(xué)版),2023，（09）[4]舒尚奇

人人文庫(kù)> 全部分類> 教育資料 > 幼兒教育

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論與納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論與納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔