




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、博弈論與信息經(jīng)濟學(xué)(Game Theory and Information Economics )張玲玲中國科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡三 應(yīng)用舉例博弈的戰(zhàn)略表述案例
2、- 房地產(chǎn)開發(fā)項目-假設(shè)有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億博弈戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一 博弈擴展式表述博弈的擴展式表述包括三個要素:參與人集合每個參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個參與人的支付進入者進入不進入(0,300)在位者市場進入阻撓博
3、弈樹不可置信威脅合作(40,50)斗爭(-10,0)房地產(chǎn)開發(fā)博弈4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié)
4、,終點結(jié)枝結(jié),初始結(jié) 信息集一 博弈擴展式表述博弈的基本構(gòu)造結(jié): 包括決策結(jié)和終點結(jié)兩類;決策結(jié)是參與人行動的始點,終點結(jié)是決策人行動的終點.結(jié)滿足傳遞性和非對稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。枝: 枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇.信息集: 每個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié):1 每個決策結(jié)都是同一個參與人的決策結(jié);2 該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié).A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開
5、發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時不確切地知道自然的選擇; B的決策結(jié)由4個變?yōu)?個房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈一 博弈擴展式表述只包含一個決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因為自然在參與人決策之后
6、行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。不同的博弈樹可以代表相同的博弈,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。 B知道自然的選擇;但不知道A的選擇(或A、B同時決策) A既不知道N也不知道B的選擇 N開發(fā)不開發(fā)AA大小1/21/2BBBA開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)N開發(fā)不開發(fā)BB大小1/21/2AAAA開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,
7、1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) A? 房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)二 占優(yōu)戰(zhàn)略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的擴展式表述囚徒困境博弈的擴展式表述智豬博弈的擴展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡擴展
8、式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例博弈的劃分博弈的劃分:從參與人行動的先后順序:靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈:參與人同時選擇行動或非同時行動但后行動者并不知道前行動者采取了什么具體行動;動態(tài)博弈:參與人行動有先后順序,且后行動者能夠觀察先行動者選擇的行動。博弈的劃分參與人對其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)的知識:完全信息博弈和不完全信息博弈。完全信息:每一個參與人對所有其他參與人的(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的 知識,否則為不完全信息。博弈的劃分: 行動順序
9、信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)完全信息靜態(tài)博弈的特點?占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)考慮下列問題:一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?納什均衡假定每一個參與人在選擇自己的最
10、優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈精練納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述擴展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結(jié)果:存
11、在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個均衡結(jié)果將最終出現(xiàn)?需求小的情況完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。承諾行動與子博弈精練納什均衡承諾行動與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因為它包含了不可置信的威脅戰(zhàn)略,如果參
12、與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動.完全承諾:承諾可以使某項行動完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個行動的成本而不是使該活動完全沒有可能.承諾行動與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈 如果在A決策之前,B與某客戶簽定了一個合同,規(guī)定B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個合同就是承諾行動.(1,-3.5)完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1
13、965) 曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻破袁之策,程昱獻了十面埋伏之計,他讓曹操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什
14、么行動,是參與人的“相機行動方案”。在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。擴展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待”博弈到達一個自己的信息集
15、(包含一個或多個決策結(jié)后,再采取行動方案。什么是動態(tài)博弈?擴展式表述博弈的納什均衡若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(開發(fā),不開發(fā));B有兩個信息集,四個可選擇的行動,B有四個純戰(zhàn)略:開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā);追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā);對抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā);不開發(fā)策略不論A開發(fā)不開發(fā)我不開發(fā),簡寫為:(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號內(nèi)的第一個元素對應(yīng)A選擇“開發(fā)”時B的選擇,第二個元素對應(yīng)A選擇“不開發(fā)”時B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-
16、3)(1,0)(0,1)(0,0)不開發(fā)xx什么是參與人的戰(zhàn)略?擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx開發(fā),(開發(fā),不開發(fā))納什均衡與均衡結(jié)果:存在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果擴展式-3, -3-3, -31, 01, 00, 10, 00, 10
17、, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx開發(fā),(開發(fā),不開發(fā))路徑在擴展式博弈中,所有n個參與人的一個純戰(zhàn)略組合決定了博弈樹上的一個路徑。(開發(fā),不開發(fā),開發(fā))決定了博弈的路徑為A開發(fā)B不開發(fā)-(1,0)(不開發(fā),開發(fā),開發(fā))決定了路徑:?第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題
18、三 應(yīng)用舉例子博弈精煉納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟學(xué)透視里發(fā)表文章,提出一個例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸
19、。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,弟弟是理性人,他的告狀威脅是不可置信的。擴展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結(jié)果:存在三個純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個均衡結(jié)果將最終出現(xiàn)?子
20、博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)) 如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開發(fā),A預(yù)測到自己的選擇對B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A選擇開發(fā),B選擇不開發(fā)。xx 對于(不開發(fā),(開發(fā),開發(fā)),這個組合之所以構(gòu)成納什均衡,是因為B威脅不論A開發(fā)還是不開發(fā),他都將選擇開發(fā),A相信了B的威脅,不開發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢? 畢竟,如果A真開發(fā),B選擇開發(fā)得-3,不開發(fā)得0,所以B的最
21、優(yōu)選擇是不開發(fā)。如果A知道B是理性的,A將選擇開發(fā),逼迫B選擇不開發(fā)。自己得1,B得0,即納什均衡(不開發(fā),(開發(fā),開發(fā))是不可置信的。因為它依賴于B的一個不可置信的威脅。 同樣: (不開發(fā),不開發(fā))也是一個不可置信威脅,納什均衡(開發(fā),(不開發(fā),不開發(fā))是不合理的。子博弈精練納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。什么是子博弈,什么是子博弈精練納什均衡?有沒有更好的方法找到子博弈精練納什均衡?完全信息動態(tài)博弈-子博弈精練納什均
22、衡澤爾騰(1965)子博弈:是原博弈的一部分,它本身也可以作為一個獨立的博弈進行分析:(1)子博弈必須從一個單結(jié)信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié)。如果信息集包含兩個以上的決策結(jié),則這兩個都不可以作為子博弈的初始結(jié)(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x和x在原博弈中屬于同一信息集時,他們在子博弈中才屬于同一信息集。習(xí)慣上,任何博弈的本身稱為自身的一個子博弈。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不
23、開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0)(-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)子博弈精練
24、納什均衡: 擴展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)成 在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā) 判斷下列均衡結(jié)果哪個構(gòu)成子博弈精練納什均衡?不開發(fā)bc完全信息動態(tài)博弈-子博弈精
25、練納什均衡澤爾騰(1965)如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實質(zhì)區(qū)別。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個決策結(jié))上選擇什么行動,即使這種情況實際上沒有發(fā)生(甚至參與人并不預(yù)期它會發(fā)生)。因此,只有當(dāng)一個戰(zhàn)略規(guī)定
26、的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)2(2,2)R 給定博弈達到最后一個決策結(jié),該決策結(jié)上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡 倒數(shù)第二個決策
27、結(jié),找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)成一個納什均衡。 如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個過程的最后一步得到整個博弈的納什均衡完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)1UDL(1,1)22,0RU(3,0)(0,
28、2)2D 子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識。如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)進入者進入不進入(0,300)在位者市場進入阻撓博弈樹不可置信威脅支付函數(shù)行動合作(40,5
29、0)斗爭(-10,0)作業(yè)強盜分贓(向前展望,倒后推理)有5個強盜搶得10枚硬幣,在如何分贓上爭論不休,于是他們決定:(1)抽簽決定個人的號碼(1,2,3,4,5)(2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同于就通過,否則他被扔進大海喂鯊魚;(3)1號死后,2號提方案,4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過,否則2號被扔進大海;(4)依次類推,知道找到一個每個人都接受的方案(當(dāng)然,如果只剩5號,他獨吞)結(jié)果會如何?作業(yè)強盜1234501001000098011970120970102完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)練習(xí):-作業(yè)6參與人1(丈夫)和參與人2(
30、妻子)必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘,下雨時帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時每人的效用為-5,不下雨時每人的效用為1;給出下列四種情況下的擴展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會下雨;并且兩人同時決定是否帶傘(即每一方在決策時都不知道對方的決策);(2)兩人在出門前都不知道是否會下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,
31、丈夫后決策.第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例承諾行動與子博弈精練納什均衡承諾行動與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因為它包含了不可置信的威脅戰(zhàn)略,如果參與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動.完全承諾:承諾可以使某項行動完全沒有可能(破釜沉舟).不完
32、全承諾:承諾只是增加了某個行動的成本而不是使該活動完全沒有可能.承諾行動與子博弈精練納什均衡 曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻破袁之策,程昱獻了十面埋伏之計,他讓曹操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。承諾行動與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈 如果在A決策之前,B與某客戶簽定了一個合同,規(guī)定B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個合同就是
33、承諾行動.(1,-3.5)承諾行動與子博弈精練納什均衡經(jīng)常有這樣的情況,非理性-通常是自動的而不是策略性的-是一個優(yōu)勢。在電影怪愛博士中的末日機器就是一個例子。前蘇聯(lián)認為不可能在一場理性的軍備競賽中超過更富有的美國,所以,他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動炸毀整個世界。著部電影描述了這樣一個細節(jié),你必須告訴對方你有這么一個末日機器。據(jù)說前美國總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對這個策略更復(fù)雜的看法:我稱為瘋子理論,我要讓北越相信我已經(jīng)到了無論付出多少都要結(jié)束戰(zhàn)爭的地步,我們只要他聽到這樣的傳聞:“看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時候,我們沒法制止他,他的手
34、已經(jīng)按在核按紐上了。”胡志明兩天之后會到巴黎求和的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟學(xué)透視里發(fā)表文章,提出一個例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。的確,如果弟弟是
35、會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 擴展式表述博弈的納什均衡三 子博弈精練納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題多個參與人的情況蜈蚣博弈四 重復(fù)博弈和無名氏定理五 應(yīng)用舉例逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識。因此,在有多個參
36、與人或每個參與人有多次行動機會的情況下,逆向歸納法的結(jié)果可能并非如此。多個參與人的情況(2,2)如果n很小,逆向歸納法的結(jié)果逆向歸納法與子搏弈精練納什均衡的存在問題如果n很大,結(jié)果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多個參與人的情況(2,2)如果n很大 對于參與人1,獲得2單位支付前提是所有n-1個參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個參與人選擇A的概率是p=1/2,則無限次重復(fù)博弈的納什均衡為: 廠商從生產(chǎn)高質(zhì)量的產(chǎn)品開始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,
37、之后永遠生產(chǎn)低質(zhì)量的產(chǎn)品。 第一個消費者選擇購買,只要廠商不曾生產(chǎn)過低質(zhì)量的產(chǎn)品,隨后消費者繼續(xù)購買,如果廠商曾件生產(chǎn)過低質(zhì)量的產(chǎn)品,之后消費者不再購買。重復(fù)博弈的均衡結(jié)果貼現(xiàn)因子:下一期的一單位支付在這一期的價值。重復(fù)博弈參與人不固定時的重復(fù)博弈1,1-1,20,00,0廠商消費者購買不購買高質(zhì)量低質(zhì)量質(zhì)量博弈 廠商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤是2,但之后每階段利潤為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤,貼現(xiàn)值為1/(1- ) =2,廠商將不會生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費者。 消費者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時,才會購買。消費者預(yù)期不曾生產(chǎn)過
38、低質(zhì)量產(chǎn)品的廠商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選擇購買,反之亦然廠商生產(chǎn)過高質(zhì)量的產(chǎn)品.重復(fù)博弈的均衡結(jié)果 克萊因等認為這個例子可以解釋為什么消費者偏好去大商店購買東西而不信賴走街串巷的小商販。 西蒙等用類似博弈解釋雇傭關(guān)系,認為,企業(yè)存在的原因之一正式創(chuàng)造一個“長期的參與人”,這樣一個參與人由于對未來利益的考慮而更講信用。重復(fù)博弈未來影響現(xiàn)在對未來的預(yù)期,是影響我們行為的重要因素。一種是預(yù)期的收益,一種是預(yù)期的風(fēng)險。地攤、車站、旅游點不但服務(wù)質(zhì)量差,而且假貨橫行公共汽車上,兩個陌生人會為座位而爭吵,但是如果他們互相認識為什么現(xiàn)代城市人的關(guān)系如此冷漠?為什么不文明行為屢禁不止?第三章 完全信息動態(tài)搏
39、弈 -子博弈精煉納什均衡一 博弈擴展式表述二 擴展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價模型囚徒的救贖旅行者困境第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡斯坦克爾伯的寡頭競爭模型企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2;行動順序:企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀測到q1,然后選 擇自己的產(chǎn)量q2。支付: 利潤,利潤是兩個企業(yè)產(chǎn)量的函數(shù)斯坦克爾伯的寡頭競爭模型qi :第i個企業(yè)的產(chǎn)量C:代表單位不變成本假定逆需求函數(shù)為:第i個企業(yè)的利潤函數(shù)為:企業(yè)1企業(yè)2斯坦克爾伯的寡頭競爭模型用你向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的
40、最優(yōu)選擇。企業(yè)2的問題是:最優(yōu)化一階條件意味著:因為企業(yè)1預(yù)測到企業(yè)2將根據(jù)S2(q1)來選擇q2,企業(yè)1在第1階段的問題是:斯坦克爾伯的寡頭競爭模型均衡結(jié)果比較壟斷情況下庫諾特寡頭競爭模型斯坦克爾伯寡頭競爭模型產(chǎn)量A:A:B:B:總產(chǎn)量利潤A:A:B:B:總利潤斯坦克爾伯的寡頭競爭模型從上述計算可以看出:斯坦克爾伯的均衡總產(chǎn)量大于庫諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯的均衡產(chǎn)量小于庫諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤大于在庫諾特博弈中的利潤,企業(yè)2的利潤卻有所下降,這就是所謂的“先動優(yōu)勢”。 擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)
41、1先行動的承諾價值 :企業(yè)1之所以獲得斯坦克爾伯利潤而不是庫諾特利潤,是因為它的產(chǎn)品一旦生產(chǎn)出來就變成了一種積淀成本,無法改變,從而使企業(yè)2不得不承認它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會相信她的威脅的。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 擴展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價模型囚徒的救贖旅行者困境輪流出價的討價還價模型分蛋糕的動態(tài)博弈游戲規(guī)則:第一輪由第一個參與人(小鵑)提出條件,第二個參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進入第二輪;小明提
42、出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?輪流出價的討價還價模型第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何? 博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若論述是奇數(shù),則小鵑得到(n+1)/2
43、n;小明得到(n-1)/(2n)輪流出價的討價還價模型通常情況下,在一個漫長的多輪的討價還價過程匯總,誰第一個提出條件并不重要?!巴讌f(xié)”的幾乎一半對一半的解決方案看來還是難以避免的。如果談判長時間陷入僵持狀態(tài),“勝方”大概什么也得不到,“敗方”自然也不會更好。最后一個提出條件的人可以得到“全部”,而全部有可能是什么也沒有,所謂“贏得戰(zhàn)役而輸?shù)魬?zhàn)爭”。參與人應(yīng)該把握第一個提出條件的機會,提出一個剛好足以引誘對方接受的條件。思考:如果討價還價過程真象上面那樣,為什么罷工還會出現(xiàn)?第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴展式表述二 擴展式表述博弈的納什均衡三 子博弈精練納什均衡四 重
44、復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價模型囚徒的救贖旅行者困境囚徒的救贖好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個被冤屈的囚犯如何憑著堅定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過好的策略合作,擺脫“困境”的詛咒。囚徒的救贖 什么是最好的策略? 在“囚徒困境”中表現(xiàn)最好的策略直接取決于對方采用的策略,特別是取決于這個策略為發(fā)展雙方合作留出了多大的余地。這個原則的基礎(chǔ)是下一步相對于當(dāng)前一步的權(quán)重足夠大,即未來是重要的。重復(fù)博弈-囚徒困境-冷酷戰(zhàn)略無限次重復(fù)博弈囚徒困境博弈重復(fù)無窮次,結(jié)果如何?證明得出,如果參與人有足夠的耐心,(抵賴,抵賴)是一個子博弈
45、精練納什均衡結(jié)果)。冷酷戰(zhàn)略(1)開始選擇抵賴;(2)選擇抵賴一直到有一方選擇了坦白,然后永遠選擇坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴 無限次重復(fù)博弈使其走出了囚徒困境,背后的原因是: 如果博弈重復(fù)無窮次而且每個人有足夠的耐心,任何短期機會主義行為的所得都是微不足道的,參與人有積極性為自己建立一個樂于合作的聲譽,同時也有積極性懲罰對方的機會主義的行為。囚徒的救贖-一報還一報一報還一報如果重復(fù)博弈多次,就有報復(fù)的機會,這種懲罰的規(guī)則是:人家對你怎么做,你就對他怎么做:如果他上次背叛了你,你這次背叛他;如果上次他與你合作,你這次就選擇與他合作。一報還一報能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。囚徒的救贖-一報還一報艾克謝羅德認為,一報還一報體現(xiàn)了這個策略符
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司演講感悟活動方案
- 公司新年大掃除活動方案
- 公司朗讀活動方案
- 2025年藥劑師執(zhí)業(yè)資格考試試卷及答案
- 2025年新媒體與網(wǎng)絡(luò)傳播課程核心知識考試試題及答案
- 2025年現(xiàn)代經(jīng)濟學(xué)與區(qū)域發(fā)展考試試卷及答案
- 2025年數(shù)字圖書館建設(shè)與管理專業(yè)模擬考試卷及答案
- 2025年人際關(guān)系與溝通能力考試試題及答案
- 2025年數(shù)字版權(quán)管理師考試試卷及答案
- 2025年去中心化金融領(lǐng)域職業(yè)資格測試題及答案
- 開源節(jié)流、降本增效
- GB/T 18860-2002摩托車變速V帶
- GB/T 16604-2008滌綸工業(yè)長絲
- GB 38031-2020電動汽車用動力蓄電池安全要求
- 計算流體力學(xué)完整課件
- 國開作業(yè)《監(jiān)督學(xué)》形成性考核(三)參考(含答案)238
- 人因工程學(xué)課后習(xí)題及解答
- 2022年廣東省中考地理試卷(含答案)
- 機關(guān)檔案管理工作培訓(xùn)課件
- 石材產(chǎn)品質(zhì)量保證書
- 部編版五年級語文下冊作文范文全套
評論
0/150
提交評論