


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、.論納什均衡與“囚徒困境的解決方式摘要 本文對(duì)于“囚徒困境與納什平均進(jìn)展了簡(jiǎn)要分析,提出了靜態(tài)博弈中要找出自己的優(yōu)勢(shì)策略以及動(dòng)態(tài)博弈中合作重要性的觀點(diǎn)。關(guān)鍵詞:“囚徒困境 優(yōu)勢(shì)策略 合作一、 “囚徒困境博弈及其納什均衡“囚徒困境博弈是圖克Tucker1950年提出的一個(gè)著名的博弈模型,是完全信息靜態(tài)博弈的典型例子。囚徒困境博弈的根本情況如下:警察抓住了兩個(gè)合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果其中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同盟,并給他們同樣的選擇時(shí)機(jī);如果他們兩人都拒不認(rèn)罪,那么他們會(huì)被以較輕的
2、阻礙公務(wù)罪各判1年徒刑;如果兩人中有一人坦白認(rèn)罪,那么坦白者從輕認(rèn)罪,立即釋放,而另一人那么將重判8年徒刑;如果兩人同時(shí)坦白認(rèn)罪,那么他們將被各判5年監(jiān)禁如果分別用1、5和8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即釋放的得益,那么兩囚徒的得益矩陣如下: 囚徒2坦白不坦白坦白-5,-50,-8不坦白-8,0-1,-1 囚徒1在上圖中,“囚徒1、“囚徒2分別代表本博弈中的兩個(gè)博弈方,也就是兩個(gè)罪犯;他們各自都有“不坦白和“坦白兩種可選擇的策略;因?yàn)檫@兩個(gè)囚徒被隔離開(kāi),其中任何一人在選擇策略時(shí)都不可能知道另一人的選擇是什么,因此不管他們決策的時(shí)間是否真正一樣,我們都可以把他們的決策
3、看作是同時(shí)做出的。其中矩陣中第一個(gè)數(shù)字代表決策結(jié)果后囚徒1的得益,第二個(gè)數(shù)字代表決策結(jié)果后囚徒2的得益。 博弈的結(jié)果是:由于這兩個(gè)囚徒之間不能串通,并且各人都追求自己的最大利益而不會(huì)顧及同伙的利益,雙方又都不敢相信或者說(shuō)指望對(duì)方有合作精神,因此只能實(shí)現(xiàn)對(duì)他們都不理想的結(jié)果各判5年,并且這個(gè)結(jié)果具有必然性,很難擺脫,因此這個(gè)博弈被稱為“囚徒困境。二、 尋找自己的優(yōu)勢(shì)策略從“極小極大原理到“納什理論,都是希望提醒博弈中的策略選擇和博弈結(jié)果之間的關(guān)系,使博弈論研究可以在一個(gè)博弈構(gòu)造里尋找比擬穩(wěn)定的結(jié)果,并為策略的選擇提供依據(jù)。比方在“囚徒困境中,雙方招供是“理性的解,因?yàn)榫蛦畏矫鎭?lái)說(shuō),無(wú)論對(duì)方招不招
4、供,你招供都是最正確決策,于是結(jié)果就是雙方招供,這個(gè)結(jié)果其實(shí)并不好,但最可能出現(xiàn)。為什么會(huì)出現(xiàn)這個(gè)不好的結(jié)果呢.因?yàn)閷?duì)于任何一方來(lái)說(shuō),這個(gè)結(jié)果還不是最壞的總比自己?jiǎn)为?dú)受過(guò)要好。這符合決策的“極小極大原理的,正如著名作家卡爾維諾在"寒冬夜行人"中所說(shuō):“有時(shí)候,你能指望的最正確結(jié)果就是防止最壞情況。這句不經(jīng)意的話其實(shí)完全可以作為“極小極大原理的一個(gè)淺顯易懂的定義。當(dāng)身處類(lèi)似“囚徒困境這樣同時(shí)行動(dòng)的靜態(tài)博弈中時(shí)最正確策略是什么.“極小極大原理告訴我們:雙方的策略選擇往往是有跡可循的,并形成某種“定式,既然如此,只要找到方法提醒這個(gè)定式,就可以為自己的策略選擇找到依據(jù),同時(shí)也可以
5、知道博弈的結(jié)果。什么是優(yōu)勢(shì)策略.即某些時(shí)候它勝于其他策略,且任何時(shí)候都不會(huì)比其他策略差。假設(shè)一個(gè)玩家擁有這么一個(gè)策略,他的決策將會(huì)變的非常簡(jiǎn)單,因?yàn)樗梢赃x擇這個(gè)優(yōu)勢(shì)策略,完全不必?fù)?dān)憂其他對(duì)手怎么行事。很多人誤解了優(yōu)勢(shì)策略的“優(yōu)勢(shì)終究是對(duì)什么而言的,所謂“優(yōu)勢(shì)策略是指無(wú)論對(duì)手采用什么策略,你的這個(gè)策略的結(jié)果都要比你選擇其他策略更好,而不是對(duì)你的對(duì)手的策略占有優(yōu)勢(shì)。另一個(gè)常見(jiàn)的誤解在于一個(gè)優(yōu)勢(shì)策略必須滿足一個(gè)條件,即采用優(yōu)勢(shì)策略得到的最壞結(jié)果也要比采用另外一個(gè)策略得到的最正確結(jié)果好,但這并非優(yōu)勢(shì)策略的普遍特征。比方“囚徒困境中“背叛是雙方的優(yōu)勢(shì)策略,但“雙方背叛結(jié)果卻并不比“雙方合作好。不是所有
6、博弈都有優(yōu)勢(shì)策略,實(shí)際上優(yōu)勢(shì)與其說(shuō)是帶有一定規(guī)律性,不如說(shuō)是一種例外。雖然出現(xiàn)一個(gè)優(yōu)勢(shì)策略可以大大簡(jiǎn)化行動(dòng)的規(guī)那么,但這些規(guī)那么卻并不適用于大多數(shù)現(xiàn)實(shí)生活中的博弈。三、 重復(fù)“囚徒困境:合作是可能的一對(duì)未來(lái)的預(yù)期,是影響人們行為的重要因素。如果未來(lái)是重要的,那么就不存在制勝策略。在“囚徒困境中,“社會(huì)人和“理性人是有區(qū)別的,為什么可以在邏輯上得到完美證明的“囚徒困境,并不能成為人們普遍遵循的選擇.于是,現(xiàn)在的問(wèn)題變成了尋找如何進(jìn)展合作的充分必要條件了。顯然,生活中的人們打交道通常不是一次性的。那么,參加博弈次數(shù)又會(huì)怎樣.設(shè)想這個(gè)游戲要進(jìn)展屢次,而且雙方都知道具體次數(shù),那么雙方仍然沒(méi)有合作的動(dòng)機(jī)
7、:首先,最后一次大家顯然是不合作的。在倒數(shù)第二次時(shí),雙方還是沒(méi)有合作的動(dòng)機(jī)。因?yàn)樗齻兌碱A(yù)知對(duì)方在最后一次會(huì)背叛。如此推理下去,對(duì)兩位自私者任何次數(shù)的游戲,從第一次開(kāi)場(chǎng)就是雙方背叛。然而,這個(gè)推理并不適用于游戲要進(jìn)展無(wú)限屢次的情況。當(dāng)游戲次數(shù)無(wú)限時(shí),合作是有出現(xiàn)的可能。在實(shí)際生活中,對(duì)未來(lái)的預(yù)期是影響人們行為的重要因素。一種是預(yù)期收益:這樣做將會(huì)有什么好處;一種是預(yù)期風(fēng)險(xiǎn):這樣做將會(huì)面臨什么問(wèn)題。這些考慮會(huì)影響到人們現(xiàn)實(shí)的選擇。比方像地?cái)?、?chē)站、旅游點(diǎn)這樣的人群流動(dòng)性大的地方,不但商品和效勞質(zhì)量最差,而且假貨橫行,因?yàn)檫@里商家不必為未來(lái)考慮一個(gè)旅客不大可能因?yàn)槟愕娘埐丝煽诙俅喂馀R,一錘子買(mǎi)賣(mài)不
8、賺白不賺。而在比擬穩(wěn)定的人際關(guān)系中,人們就普遍比擬注意禮節(jié)和誠(chéng)信,因?yàn)樵谶@個(gè)環(huán)境里,人們不能不考慮長(zhǎng)期影響。從消極的層面看,我們互不侵犯,是為了防止沒(méi)完沒(méi)了、兩敗俱傷的循環(huán)報(bào)應(yīng)。二在一個(gè)“非零和博弈中,贏得良好的結(jié)果往往不是靠戰(zhàn)勝對(duì)方,而是靠引導(dǎo)對(duì)方做出對(duì)雙方都有利的行為。人們往往習(xí)慣考慮零和對(duì)局,在這種情況下,一個(gè)人贏,另一個(gè)就輸。為了能贏,一個(gè)參賽者必須在大局部時(shí)間里比對(duì)手做得更好。然而生活中的大多數(shù)情況都是非零和的。雙方可以都做得很好,也可以都做得很差。合作是可能的,但并不是總能實(shí)現(xiàn)。這就是為什么“囚徒困境是各種各樣的日常情形的有用模型。人們傾向于采用相對(duì)的標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)經(jīng)常把對(duì)方的成功與自己對(duì)立起來(lái),這種標(biāo)準(zhǔn)導(dǎo)致了嫉妒,嫉妒導(dǎo)致企圖抵消對(duì)方已經(jīng)得到的優(yōu)勢(shì),在“囚徒困境的形勢(shì)下,抵消對(duì)方優(yōu)勢(shì)只能通過(guò)背叛來(lái)實(shí)現(xiàn),但是背叛將導(dǎo)致更多的背叛和對(duì)雙方的懲罰。因此在一個(gè)非零和的世界里,沒(méi)有必要非得比對(duì)方做得更好。特別要和許多不同的對(duì)手打交道時(shí)更是這樣。只要自己能做得好就沒(méi)有理由去嫉妒對(duì)方的成功。因?yàn)樵陂L(zhǎng)時(shí)間的“重復(fù)囚徒困
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- C公司農(nóng)林生物質(zhì)熱電聯(lián)產(chǎn)項(xiàng)目風(fēng)險(xiǎn)管理研究
- 低碳烴吸附分離純化功能導(dǎo)向的金屬有機(jī)骨架材料的設(shè)計(jì)合成與性能調(diào)控研究
- 五四時(shí)期青年知識(shí)分子對(duì)先進(jìn)社團(tuán)的影響研究
- 雪思念女孩450字14篇范文
- 森林伙伴去春游300字13篇
- 2024年威海市市屬事業(yè)單位選聘工作人員考試真題
- 2024年上海醫(yī)藥職工大學(xué)輔導(dǎo)員考試真題
- 我和我的夢(mèng)想人物作文(11篇)
- 2024年新疆昌吉州招聘中學(xué)教師筆試真題
- 《探索地理世界:自然環(huán)境考察活動(dòng)教案》
- 2023年06月江蘇南通如東縣司法局等17家單位招錄政府購(gòu)買(mǎi)服務(wù)人員124人筆試題庫(kù)含答案詳解
- 湖南三支一扶考試歷年真題
- 心肺運(yùn)動(dòng)試驗(yàn)-PPT-醫(yī)學(xué)課件
- 物流公司安全生產(chǎn)規(guī)章制度匯編
- 門(mén)診急危重癥優(yōu)先處置制度及程序全套資料
- 滅火和疏散應(yīng)急預(yù)案流程圖
- 西藏自治區(qū)建筑與市政工程竣工驗(yàn)收?qǐng)?bào)告
- 文化產(chǎn)業(yè)經(jīng)濟(jì)學(xué) 焦斌龍課件第五章 文化產(chǎn)業(yè)結(jié)構(gòu)
- GB/T 32831-2016高能激光光束質(zhì)量評(píng)價(jià)與測(cè)試方法
- GB/T 29665-2013護(hù)膚乳液
- GB/T 18024.6-2010煤礦機(jī)械技術(shù)文件用圖形符號(hào)第6部分:露天礦機(jī)械圖形符號(hào)
評(píng)論
0/150
提交評(píng)論