




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論與納什均衡博弈論與納什均衡《博弈論與納什均衡理論》姓名張賀祺學(xué)號(hào)2023010404專業(yè)政治經(jīng)濟(jì)學(xué)指導(dǎo)老師張秉云摘要博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題,具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒(méi)有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說(shuō),是一種非合作博弈狀態(tài)。關(guān)鍵字:博弈論;納什均衡;合作博弈;非合作博弈目錄摘要(2)關(guān)鍵字(2)一、引言(4)二、博弈論與納什均衡的主要內(nèi)容(4)(一)博弈論的主要思想(4)(二)博弈論的分類(5)三、經(jīng)典案例(7)(一)博弈論的經(jīng)典案例(7)(二)納什均衡經(jīng)典案例(7)四、博弈論和納什均衡的重要影響(8)(一)博弈論的重要影響(8)(二)納什均衡的重要影響(8)參考文獻(xiàn)(9)博弈論與納什均衡理論一、引言近代對(duì)于博弈論的研究,開(kāi)始于策墨咯(Zermelo),波雷爾(Borel)及馮·諾伊曼(vonNeumann)。1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時(shí)代巨著《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟(jì)領(lǐng)域,從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950~1951年,約翰·福布斯·納什(JohnForbesNashJr)利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。納什的開(kāi)創(chuàng)性論文《n人博弈的均衡點(diǎn)》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,塞爾頓、哈桑尼的研究也對(duì)博弈論發(fā)展起到推動(dòng)作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。博弈論(GameTheory):亦名“對(duì)策論”、“賽局理論”,屬應(yīng)用數(shù)學(xué)的一個(gè)分支,主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題,具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。納什均衡:(Nashequilibrium)又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰·納什命名。假設(shè)有n人局中人參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的最優(yōu)策略(個(gè)人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合(StrategyProfile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒(méi)有人有足夠理由打破這種均衡。納什均衡,從實(shí)質(zhì)上說(shuō),是一種非合作博弈狀態(tài)。二、博弈論與納什均衡的主要內(nèi)容(一)博弈論的主要思想一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過(guò)程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。博弈論模型可以用五個(gè)方面來(lái)描述:G={P,AS,I,U)P:為局中人,博弈的參與者,也稱為博弈方,局中人是能夠獨(dú)立決策,獨(dú)立承擔(dān)責(zé)任的個(gè)人或組織,局中人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。決策人:在博弈中率先做出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗(yàn)和表面狀態(tài)優(yōu)先采取一種有方向性的行動(dòng)。對(duì)抗者:在博弈二人對(duì)局中行動(dòng)滯后的那個(gè)人,與決策人要做出基本反面的決定,并且他的動(dòng)作是滯后的、默認(rèn)的、被動(dòng)的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢(shì)的策略選擇,因此對(duì)抗是唯一占優(yōu)的方式,實(shí)為領(lǐng)導(dǎo)人的階段性終結(jié)行為。局中人(players):在一場(chǎng)競(jìng)賽或博弈中,每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人。只有兩個(gè)局中人的博弈現(xiàn)象稱為兩人博弈,而多于兩個(gè)局中人的博弈稱為多人博弈。A:為各局中人的所有可能的策略或行動(dòng)的集合。根據(jù)該集合是有限還是無(wú)限,可分為有限博弈和無(wú)限博弈,后者表現(xiàn)為連續(xù)對(duì)策、重復(fù)博弈和微分對(duì)策等。策略(strategy):一局博弈中,每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案,即方案不是某階段的行動(dòng)方案,而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案,一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案,稱為這個(gè)局中人的一個(gè)策略。如果在一個(gè)博弈中局中人都總共有有限個(gè)策略,則稱為“有限博弈”,否則稱為“無(wú)限博弈”。S:博弈的進(jìn)程:也是博弈進(jìn)行的次序、局中人同時(shí)行動(dòng)的一次性決策的博弈,稱為靜態(tài)博弈;局中人行動(dòng)有先后次序,稱為動(dòng)態(tài)博弈。I:博弈信息,能夠影響最后博弈結(jié)局的所有局中人的情報(bào)。信息在博弈中占重要的地位,博弈的贏得很大程度上依賴于信息的準(zhǔn)確度與多寡。得益信息是博弈中的重要信息,如果博弈各方對(duì)各種局勢(shì)下所有局中人的得益狀況完全清楚,稱之為完全信息博弈。反之為不完全信息博弈。在動(dòng)態(tài)博弈中還有一類信息:輪到行動(dòng)的博弈方是否完全了解此前對(duì)方的行動(dòng)。如果完全了解則稱之為具有完美信息的博弈。反之稱為不完美信息的動(dòng)態(tài)博弈。由于信息不完美,博弈的結(jié)果只能是概率期望,而不能像完美信息博弈那樣有確定的結(jié)果。U:為局中人獲得利益,也是博弈各方追求的最終目標(biāo)。根據(jù)各方得益的不同情況,分為零和博弈與變和博弈。零和博弈中各方利益之間是完全對(duì)立的。變和博弈有可能存在合作關(guān)系,爭(zhēng)取雙贏的局面。得失(payoffs):一局博弈結(jié)局時(shí)的結(jié)果稱為得失。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。次序(orders):各博弈方的決策有先后之分,且一個(gè)博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問(wèn)題;其他要素相同次序不同,博弈就不同。(二)博弈論的分類博弈模型一般分為合作博弈(cooperativegame)和非合作博弈(non-cooperativegame),如圖1.1。合作博弈是以單個(gè)參與者的可能行動(dòng)集合為基本元素,而非合作博弈是以參與人群的可能聯(lián)合行動(dòng)集合為基本元素(MartinJ.OsborneandArielRubinstein,2000,P2),也就是說(shuō),在合作博弈中,博弈中所有參與者都獨(dú)立行動(dòng),不存在有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系,而在非合作博弈中,在一些參與者之間存在著有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系,并因?yàn)檫@種關(guān)系影響到博弈的結(jié)局。合作博弈強(qiáng)調(diào)的是團(tuán)體理性(collectiverationality)、效率、公正和公平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是低效率或無(wú)效率的(張維迎,1996,P5)。20世紀(jì)50年代,合作博弈的研究達(dá)到鼎盛期,同時(shí)開(kāi)始出現(xiàn)對(duì)非合作博弈的研究,此后,博弈論的研究主流逐步轉(zhuǎn)向在非合作博弈領(lǐng)域。有些人認(rèn)為非合作博弈模型比合作博弈更“基本”,但有些人認(rèn)為兩者不相上下(MartinJ.OsborneandArielRubinstein,2000,P2)。合作博弈,有時(shí)也叫做聯(lián)盟博弈(coalitionalgame),一般根據(jù)有無(wú)轉(zhuǎn)移支付而分為兩類:可轉(zhuǎn)移支付聯(lián)盟博弈(coalitionalgamewithtransferablepayoff)和不可轉(zhuǎn)移支付聯(lián)盟博弈(coalitionalgamewithnon-transferablepayoff)??赊D(zhuǎn)移支付也叫有旁支付(sidepayment),可轉(zhuǎn)移支付聯(lián)盟博弈假設(shè)博弈中各參與者都用相同的尺度來(lái)衡量他們的贏得,且各聯(lián)盟的贏得可以按任意方式在聯(lián)盟成員中分?jǐn)?;否則,就是不可轉(zhuǎn)移支付聯(lián)盟博弈。非合作博弈的分類主要從兩個(gè)角度進(jìn)行劃分。一是參與者的行動(dòng)順序。從這個(gè)角度博弈可以分為靜態(tài)博弈(staticgame)和動(dòng)態(tài)博弈(dynamicgame)。靜態(tài)博弈是指參與者同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知前行動(dòng)者采取了何種行動(dòng);動(dòng)態(tài)博弈是指參與者的行動(dòng)有先后順序且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。二是參與者掌握的信息水平。從這個(gè)角度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息(completeinformation)指的是每一個(gè)參與者對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí);否則就是不完全信息(incompleteinformation)。圖1.1博弈的分類綜合上述兩種分類方法,可將非合作博弈分成四類。這四類博弈及其對(duì)應(yīng)的均衡概念,大致上反映了20世紀(jì)50年代以來(lái)非合作博弈理論的主要進(jìn)展和1994年三位諾貝爾經(jīng)濟(jì)學(xué)將得主的主要貢獻(xiàn),同時(shí)也大致表明了“納什均衡”及其精煉在博弈論發(fā)展中的地位和影響(如表2.1)。表2.1非合作博弈的分類及對(duì)應(yīng)的均衡概念、主要貢獻(xiàn)者三、經(jīng)典案例(一)博弈論的經(jīng)典案例智豬博弈(Pigs’payoffs)講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會(huì)落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽,爭(zhēng)吃到另一半殘羹。那么,兩只豬各會(huì)采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因?yàn)椋∝i踩踏板將一無(wú)所獲,不踩踏板反而能吃上食物。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。槍手博弈:王者的悲哀。三人對(duì)槍自決,甲乙丙槍法優(yōu)劣遞減。最后無(wú)奈而神奇的結(jié)局,將不取決于同時(shí)開(kāi)槍還是先后開(kāi)槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因?yàn)闆](méi)有人會(huì)把威脅最小的槍手列為一號(hào)清楚目標(biāo)。在這里,后發(fā)制人的弱勢(shì)者將勝出。以弱勝?gòu)?qiáng),絕不是神話。(二)納什均衡經(jīng)典案例和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營(yíng)銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面:(1)改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。(2)擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問(wèn)題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問(wèn)題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。(3)加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理,分析問(wèn)題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問(wèn)題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問(wèn)題。(4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問(wèn)題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。(5)擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀ǎ移胀ǖ綆缀鯚o(wú)處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。(6)改變了經(jīng)濟(jì)學(xué)的語(yǔ)言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利(Kandori,1997)對(duì)保羅·薩繆爾森(PaulSamuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過(guò)一個(gè)幽默的引申,他說(shuō),“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。參考文獻(xiàn)[1]李伯聰,李軍.關(guān)于囚徒困境的幾個(gè)問(wèn)題[J].自然辯證法通訊,2023,(04)[2]丁華,周洋,韓雪峰.“囚徒困境”的引申與啟示[J].職業(yè)時(shí)空,2023,(01)[3]馬立強(qiáng).囚徒困境與納什均衡[J].科學(xué)大眾(中學(xué)版),2023,(09)[4]舒尚奇
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 拖拉機(jī)售后服務(wù)網(wǎng)絡(luò)考核試卷
- 種子批發(fā)商產(chǎn)品組合策略與優(yōu)化考核試卷
- 2024年汽車地毯資金需求報(bào)告代可行性研究報(bào)告
- 房產(chǎn)增值收益調(diào)整與分配變更管理協(xié)議
- 2025年中國(guó)變速箱壓鑄件行業(yè)市場(chǎng)前景預(yù)測(cè)及投資價(jià)值評(píng)估分析報(bào)告
- 房地產(chǎn)項(xiàng)目土地開(kāi)發(fā)與地籍測(cè)繪全方位合作協(xié)議
- 生物技術(shù)實(shí)驗(yàn)室共建與人才培養(yǎng)及科研項(xiàng)目管理合同
- 網(wǎng)絡(luò)媒體廣告內(nèi)容審查標(biāo)準(zhǔn)服務(wù)協(xié)議
- 2025年中國(guó)北京農(nóng)業(yè)行業(yè)市場(chǎng)前景預(yù)測(cè)及投資價(jià)值評(píng)估分析報(bào)告
- 網(wǎng)絡(luò)文學(xué)作品有聲化改編權(quán)許可及衍生品開(kāi)發(fā)合同
- 商場(chǎng)超市公司章程
- 1與食品經(jīng)營(yíng)相適應(yīng)的操作流程
- 農(nóng)險(xiǎn)理賠培訓(xùn)
- 制藥車間5S標(biāo)準(zhǔn)化管理
- 寫字樓租賃技巧培訓(xùn)
- T-CEEAS 003-2024 養(yǎng)老合規(guī)師職業(yè)技能評(píng)價(jià)標(biāo)準(zhǔn)
- 鋼筋混凝土蓄水池設(shè)計(jì)方案
- 2025年保密知識(shí)試題庫(kù)帶答案(考試直接用)
- 伊斯蘭教完整版本
- 【MOOC】大學(xué)物理-力學(xué)、電磁學(xué)-重慶大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 擋土墻施工圖設(shè)計(jì)說(shuō)明(完整版)
評(píng)論
0/150
提交評(píng)論