




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
Microeconomics中央財(cái)經(jīng)大學(xué)宋一淼ogscs@微觀經(jīng)濟(jì)學(xué)Chapter12GameTheoryandCompetitiveStrategy博弈論和競爭策略博弈論和競爭策略要討論的問題博弈和決策占優(yōu)策略均衡納什均衡一、博弈和決策博弈的含義:研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。博弈(game)的基本構(gòu)成要素參與者(participant)策略或行動(strategy):參與者在博弈中遵循的行動規(guī)則或計(jì)劃。支付(得益)(payoff):如以匯報(bào)或利潤等方式表示的產(chǎn)出;拍賣中贏家的支付即其CS一、博弈和決策博弈的分類:非合作博弈與合作博弈合作博弈(cooperativegame)參與者可以談定能使它們設(shè)計(jì)聯(lián)合策略的有約束力的合同例子:買賣雙方商議一種商品或服務(wù)的價(jià)格,或者兩廠商的合資企業(yè)(如微軟和IBM)簽訂一份能夠分配聯(lián)合投資利潤的有約束力的合同。使得雙方都獲益的合作的結(jié)果是有可能的,也就是有約束力的合同是可能的一、博弈和決策非合作博弈(noncooperativegame)談判和執(zhí)行有約束力的合同是不可能的例子:假定其它廠商的行為,兩個(gè)競爭性廠商獨(dú)自決定價(jià)格和廣告策略,以獲得市場份額。再如,拍賣時(shí)每一個(gè)投標(biāo)者在做出自己的最優(yōu)投標(biāo)決策時(shí),都必須考慮其他投標(biāo)者可能的行動。有約束力的合同是不可能的——這也是合作博弈與非合作博弈的基本區(qū)別。我們主要關(guān)心的是非合作博弈一、博弈和決策不論是非合作博弈還是合作博弈,策略設(shè)計(jì)都應(yīng)滿足:以理解你的對手的觀點(diǎn)為基礎(chǔ),且(假定你的對手是理性的,)推斷他或她對你的行動的可能反應(yīng)。-5,-5-1,-10-2,-2-10,-1例子:囚徒困境
(prisoners’dilemma)
注意以下的支付是負(fù)的。他們不能共謀,且即使共謀也難以互相信任。結(jié)果無論A還是B都以坦白作為總是最優(yōu)方案。囚徒A坦白不坦白坦白不坦白囚徒B你選擇坦白嗎?博弈的分類(續(xù))從行為的時(shí)間序列性,博弈論分為靜態(tài)博弈、動態(tài)博弈兩類:靜態(tài)博弈是指在博弈中,參與人同時(shí)選擇或雖非同時(shí)選擇但后行動者并不知道先行動者采取了什么具體行動;動態(tài)博弈是指在博弈中,參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。"囚徒困境"就是同時(shí)決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動有先后次序的,屬于動態(tài)博弈按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈過程中,每一位參與人對其他參與人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。不完全信息博弈是指如果參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。二、占優(yōu)策略均衡占優(yōu)策略(dominantstrategy)不論對手選擇什么策略,這個(gè)策略對自己都是最優(yōu)的。占優(yōu)策略均衡(equilibriumindominantstrategies)由所有參與者的占優(yōu)策略構(gòu)成的策略組合。例子:廣告博弈的支付矩陣廠商A做廣告不做廣告做廣告不做廣告廠商B10,515,010,26,8廣告博弈的支付矩陣從分析來看,做廣告對于廠商A是占優(yōu)策略。對于廠商B這也是正確的:不管廠商A的決定是什么,廠商B做廣告都能得到最好的結(jié)果。所以,如果設(shè)兩廠商都是理性的,則這個(gè)博弈的結(jié)果是兩個(gè)廠商都做廣告。也就是兩個(gè)廠商都有占優(yōu)策略。這樣的博弈結(jié)果也就是占優(yōu)策略均衡(equilibriumindominantstrategy)。然而,并不是每個(gè)博弈的各個(gè)參與者都有一個(gè)占優(yōu)策略。如——10,515,020,26,8廠商A做廣告不做廣告做廣告不做廣告廠商B例子:修改后的廣告博弈
A沒有占優(yōu)策略,他的最優(yōu)決策取決于B:
當(dāng)B做廣告,A最好也做;B若不做,A不做是最好選擇三、納什均衡納什均衡(Nashequilibrium)在給定其他參與者的行動后,每個(gè)參與者采取了他能采取的最優(yōu)行動。由所有參與者的最優(yōu)行動構(gòu)成的策略組合,被稱為納什均衡。給定你所做的,我采取我能采取的最優(yōu)行動;給定我所做的,你采取你能采取的最優(yōu)行動。納什均衡(Nashequilibrium)占優(yōu)策略(dominantstrategy)不管你如何行動,我都采取我能采取的最優(yōu)行動。不管我如何行動,你都采取你能采取的最優(yōu)行動。由此可以看出,占優(yōu)策略均衡是納什均衡的特例納什均衡的例子兩個(gè)早餐麥片公司一個(gè)脆麥片生產(chǎn)者的市場一個(gè)甜麥片生產(chǎn)者的市場每個(gè)廠商僅有推出一種新麥片的資源非合作的納什均衡(Nashequilibrium)產(chǎn)品選擇問題產(chǎn)品選擇問題Firm1廠商1Crispy脆Sweet甜Firm2廠商2-5,-510,10-5,-510,10Crispy脆Sweet甜海灘定位問題
競爭者定位在何處(納什均衡在何處)?若開始對手在A點(diǎn),那么你可以在他左邊即占領(lǐng)3/4的市場,而對手只有1/4的市場。但這不是一種均衡最終,兩個(gè)銷售者都會選擇C即海灘中點(diǎn)。海洋0B海灘A200碼C類似問題這個(gè)決策問題的例子包括:加油站定位總統(tǒng)選舉混合策略均衡
Mixedstrategies石頭、布、剪子的博弈
孩子B石頭布剪子孩石頭子布A剪子這里沒一個(gè)策略組合所對應(yīng)的收益要素中,兩個(gè)人的收益之和總是零,即零和博弈。上述博弈找不出每個(gè)人都最優(yōu)的策略組合,所以本博弈無均衡。如果把策略選擇過程隨機(jī)化,從混合策略的意義上來分析,仍能發(fā)現(xiàn)nash均衡。混合策略均衡
Mixedstrategies
游戲者BFC游戲者AFC若B在策略F和C之間選擇的概率密度各為1/2,則若A選擇F,A的效用就是1/2*(-1)+1/2*(1)=0;若A選擇C,A的效用仍是1/2*(1)+1/2*(-1)=0可見,B選擇F和C的概率各為1/2時(shí),A選擇F和C的效用是相同的。這說明A在這種條件下的最大效用為零,并且對F和C無差異。混合策略均衡
Mixedstrategies若A以1/2概率選擇F與C,則B在F與C無差異,而且也達(dá)到效用極大化,即零。即A與B都以(1/2,1/2)的概率選擇F與C,則它們各自都達(dá)到了效用極大化。則混合策略定義為:對于游戲者i,其一個(gè)混合策略是一個(gè)概率密度函數(shù)σi:Si->R,使得對于所有的si都有≥0,并且∑σi(Si)=1即游戲者i的混合策略是m個(gè)密度函數(shù)(若有m個(gè)可能的策略選擇)。若第i個(gè)游戲者只有兩個(gè)可能的策略選擇,則其混合策略就只是p與(1-p)兩個(gè)概率最大最小化策略
(maxminstratesy)這是一種保守的策略,又是風(fēng)險(xiǎn)比較小的策略。當(dāng)游戲者想回避風(fēng)險(xiǎn)時(shí),他會采取該策略。游戲者B左右游戲者A上下若B是理性的,他肯定會選右,因?yàn)橛艺純?yōu)于左的若A相信B是理性的,他必選下,達(dá)到A與B都收益極大化的結(jié)果(2,1)最大最小化策略
(maxminstratesy)但A這樣決策會有風(fēng)險(xiǎn):若B以損害A為目標(biāo),則B知道A會選擇下時(shí)會故意選擇左。盡管B這樣做對自己并沒有好處,反而比選右少的一個(gè)單位利益。但B達(dá)到了損害A程度最大的目標(biāo)。A若估計(jì)到這一可能性,則保守為妙——兩害相權(quán)取其輕,即最大最小化策略。A首先考慮,若選上,min{1,1}=1若選下,min{-1000,2}=-1000A的決策是從兩個(gè)壞結(jié)果中挑一個(gè)相對好一些的結(jié)果Max{min{1,1},min{-1000,2}}=max{1,-1000}=1故A選上。智豬博弈Pigs’payoffs這是一個(gè)著名的納什均衡的例子。假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時(shí),大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。在兩頭豬都有智慧的前提下,最終結(jié)果是小豬選擇等待,即等待是小豬的占優(yōu)策略。用報(bào)酬矩陣可清晰的刻畫出小豬的選擇:智豬博弈Pigs’payoffs
小豬將選擇“搭便車”策略,因?yàn)樾∝i知道它若踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)。智豬博弈Pigs’payoffs“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的現(xiàn)象嗎?改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會有踩踏板的動力了如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。
智豬博弈Pigs’payoffs改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強(qiáng)。對于游戲規(guī)則的設(shè)計(jì)者來說,這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦偁幉粡?qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。智豬博弈Pigs’payoffs改變方案三:減量加移位方案。投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。對于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。智豬博弈Pigs’payoffs“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但對于社會而言,因小豬未能參與競爭,小豬搭便車時(shí)的社會資源配置的并非最佳狀態(tài)為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。如,公司的激勵制度設(shè)計(jì),獎勵力度太大,又是持股,又是期權(quán),成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機(jī)制設(shè)計(jì)就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本,又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵。斗雞博弈(ChickenGame)其實(shí)是一種誤譯。美國口語中的Chicken是懦夫的意思,也就是應(yīng)翻譯為懦夫博弈,但錯(cuò)誤不嚴(yán)重。斗雞博弈(ChickenGame)它強(qiáng)調(diào)的是如何在博弈中采取妥協(xié)的方式獲得利益。如果雙方都換位思考,他們就可以就補(bǔ)償進(jìn)行談判,最后造成以補(bǔ)償換退讓的協(xié)議。博弈中經(jīng)常有妥協(xié),雙方若能換位思考就可以容易達(dá)成協(xié)議??紤]自己得到多少補(bǔ)償才愿意退出。只有從自己立場出發(fā)考慮問題,不愿意退讓,又不想給對方一定的補(bǔ)償,則僵局就難以打破。序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型領(lǐng)導(dǎo)型企業(yè)不一定先宣布產(chǎn)量決策,而可能先宣布價(jià)格決策。但在宣布前,領(lǐng)導(dǎo)者會考慮追隨者的反應(yīng)。因此,博弈的分析仍遵循反向歸納(backwardinduction)的思路,即先分析追隨者的反應(yīng),然后分析領(lǐng)導(dǎo)者如何選擇最優(yōu)定價(jià)問題。序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型一、追隨者的行為與殘差需求線假定領(lǐng)導(dǎo)者給出產(chǎn)品價(jià)格p,追隨者在均衡時(shí)必須接受領(lǐng)導(dǎo)者給定的價(jià)格。否則,若其喊價(jià)低于領(lǐng)導(dǎo)者的報(bào)價(jià)p,則市場需求會轉(zhuǎn)向追隨者,追隨者將不再是追隨者;若追隨者喊價(jià)高于p,則將失去全部市場。所以追隨者必然接受領(lǐng)導(dǎo)者的定價(jià)。追隨者的行為必將是選擇一個(gè)產(chǎn)量水平實(shí)現(xiàn)利潤最大化,于是追隨者的問題是:序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型這會導(dǎo)致追隨者按其MR2=MC2的原則決定產(chǎn)量,這實(shí)質(zhì)上會決定追隨者的供給曲線S2(P)一旦追隨著在領(lǐng)導(dǎo)著給定的價(jià)格p下決定了其供給函數(shù)S2(P),那么市場留給領(lǐng)導(dǎo)者的殘差需求即為D(P)-S2(P),記為R(p)(residualdemandcurve),即R(p)=D(p)-S2(P)序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型二、領(lǐng)導(dǎo)者的最優(yōu)價(jià)格選擇領(lǐng)導(dǎo)者將根據(jù)R(p)出發(fā)按照MR1=MC1的原則確定產(chǎn)出q1,最后解出相應(yīng)價(jià)格p,具體步驟:1、按MC2=P的原則確定S2(P);2、按R(p)=D(p)-S2(P)=q1的原則求出領(lǐng)導(dǎo)者面臨的殘差需求曲線;3、從殘差需求線出發(fā),按MR1=MC1的原則確定領(lǐng)導(dǎo)者的均衡產(chǎn)量q1;4、由q1解出領(lǐng)導(dǎo)者的價(jià)格水平p。序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型Case假設(shè)市場需求為D(p)=a-bp(這里D(p)是市場需求Qd),追隨者的成本為c2(q2)=q22/2,領(lǐng)導(dǎo)者的成本函數(shù)為c1(q1)=cq1。求領(lǐng)導(dǎo)者的均衡價(jià)格與均衡產(chǎn)量q1。解:先求追隨者的供給函數(shù)。因追隨者在“價(jià)格領(lǐng)導(dǎo)”模型中是“價(jià)格接受者”,所以其MR與p同一。這樣追隨者會按MC=p的原則決定其供給函數(shù)。序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型由c2(q2)=q22/2,故MC2=q2=p因此,P=q2,即S2(p),亦即S2(p)=P=q2再求領(lǐng)導(dǎo)者面臨的殘差需求R(p)=D(P)-S2(p)=a-bp-p=a-(1+b)p由于R(p)=q1,即R(p)是領(lǐng)導(dǎo)者可賣掉的產(chǎn)量,有q1=a-(1+b)p解出p=[a/(1+b)]-[1/(1+b)]q1再次,按MR1=MC1的原則確定q1即序列博弈的案例
——價(jià)格領(lǐng)導(dǎo)模型博弈論發(fā)展簡史博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負(fù)問題,人們對博弈局勢的把握只停留在經(jīng)驗(yàn)上,沒有向理論化發(fā)展,正式發(fā)展成一門學(xué)科則是在20世紀(jì)初。對于博弈論的研究,始于策墨洛(Zermelo,1913)、波雷爾(Borel,1921)及馮·諾伊曼(vonNeumann,1928),后來由馮·諾伊曼和奧斯卡·摩根斯坦(vonNeumannandMorgenstern,1944,1947)首次對其系統(tǒng)化和形式化(Myerson,1991)。隨后約翰·福布斯·納什(JohnForbesNashJr.,1950,1951)利用不動點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。博弈論發(fā)展簡史諾依曼和摩根斯坦(VonNeumann&Morgenstern)《博弈論與經(jīng)濟(jì)行為》,1944塔克(Tucker)“囚徒困境”納什(Nash)博弈均衡,1950、1951納什和夏皮萊(Nash&Shapley),1953吉爾斯(Gilles),核(Core)理論,1953德布魯和斯卡夫(Debreu&Scarf),60’s澤爾騰(Selten)完全信息,1965海薩尼(Harsanyi)不完全信息,1967、1968澤爾騰、克魯帕斯(Kreps)、繆爾格拉姆(Milgrom)、羅伯茨(Roberts)、威爾遜,重復(fù)博弈,1982
約翰·馮·諾伊曼(JohnvonNeumann1903.12.28─1957.02.08)他是一位匈牙利─美國數(shù)學(xué)家。生于匈牙利布達(dá)佩斯。奧斯卡·摩根斯坦,德國-美國經(jīng)濟(jì)學(xué)家。(OskarMorgenstern,1902.01.24-1977.07.26),他很熱心于將數(shù)學(xué)應(yīng)用于經(jīng)濟(jì)學(xué),更廣義地說,應(yīng)用于人類的各種戰(zhàn)略問題,以便獲得最大利益和盡可能地減少損失。他認(rèn)為這些原理也同樣適用于哪怕簡單得象拋擲硬幣這樣的游戲,因而提出了所謂的對策論。1944年,他同另一名流亡學(xué)者諾伊曼合著了《對策論和經(jīng)濟(jì)行為》一書。
博弈論大師:約翰·福布斯·納什(JohnForbesNashJr.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康中國戰(zhàn)略下的智慧醫(yī)院設(shè)計(jì)與建設(shè)
- 企業(yè)類贈與合同范例
- 付協(xié)調(diào)費(fèi)合同范例
- 橙青色扁平風(fēng)牙齒健康模板
- 書采編合同范例
- 會議宣傳合同范例
- 溫州市普通高中2025屆高三第三次適應(yīng)性考試英語試題及答案
- 區(qū)塊鏈技術(shù)在供應(yīng)鏈管理中的未來發(fā)展預(yù)測
- 醫(yī)技升級新篇章-基于大數(shù)據(jù)的醫(yī)療培訓(xùn)與模擬應(yīng)用研究
- 會議設(shè)備維護(hù)合同范例
- 10以內(nèi)加減法練習(xí)題1000題-直接打印版
- 教育部《中小學(xué)德育工作指南》-道德修養(yǎng)手冊
- RAG技術(shù):人工智能的新篇章
- JGT163-2013鋼筋機(jī)械連接用套筒
- 2024年7月浙江省高中學(xué)業(yè)水平考試數(shù)學(xué)試卷真題(含答案詳解)
- DL∕T 782-2001 110kV及以上送變電工程啟動及竣工驗(yàn)收規(guī)程
- 用友大易-2022雇主品牌白皮書
- JJF(通信) 068-2023 雷達(dá)回波模擬器校準(zhǔn)規(guī)范(報(bào)批稿)
- 《公路橋梁施工監(jiān)控技術(shù)規(guī)程》(JTGT3650-01-2022)
- 上交所金橋數(shù)據(jù)中心用戶手冊
- 胸腔積液考試試題
評論
0/150
提交評論