




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、博弈論:原理、模型與教程 第一部分 完全信息靜態(tài)博弈第2章 Nash 均衡本章將通過分析理性參與人在博弈中的選擇行為,探討完全信息靜態(tài)問題的求解,并給出完全信息靜態(tài)博弈的解Nash均衡。2.1 占優(yōu)行為(已精細(xì)訂正!)首先考察博弈論中最為經(jīng)典的一個(gè)博弈模型“囚徒困境”(prisoners dilemma)博弈。兩個(gè)小偷作案后被警察抓住,分別關(guān)在不同的屋子里審訊。在審訊之前,小頭偷從律師那里得知:如果兩個(gè)人都坦白,將被個(gè)判刑年;如果兩個(gè)人都抵賴,將會(huì)因?yàn)樽C據(jù)不足而各判年;如果其個(gè)一人坦白另一人抵賴,坦白的講將會(huì)得到寬大處理而被無罪釋放,而抵賴的將被重刑,判刑年。試問兩個(gè)小偷將會(huì)如何選擇?上述“囚
2、徒困境”博弈問題是Tucker在20世紀(jì)50年代提出的,該問題不僅“可以作為實(shí)際生活中許多現(xiàn)象的一個(gè)抽象概括”,而且對(duì)它的研究在一定程度上也奠定了非合作博弈論的理論基礎(chǔ)。在“囚徒困境”博弈問題中,參與人是兩個(gè)小偷,參與人的戰(zhàn)略都是:坦白和抵賴,支付就是在各種選擇下所得到的刑期。圖2-1給出了“囚徒困境”博弈問題的戰(zhàn)略式描述。 小偷2小偷1 坦白 抵賴 抵賴坦白 0,-6 -4,-4 -1,-1 -6,0圖2-1 “囚徒困境”博弈顯然,在“囚徒困境博弈”中,小偷選擇的結(jié)果不僅與自己的選擇有關(guān),而且與另一小偷的選擇有關(guān),那么小偷如何選擇呢?不妨這樣考慮小偷的決策過程:假設(shè)對(duì)方坦白,自己該怎么做;假
3、設(shè)對(duì)方抵賴,自己應(yīng)該怎么做。也就是,給定另一小偷的決策,尋找自己的最優(yōu)決策。對(duì)于每個(gè)小偷,當(dāng)對(duì)方坦白時(shí),自己坦白得,抵賴得,所以應(yīng)該選擇“坦白”;而當(dāng)對(duì)方抵賴時(shí),自己坦白得,抵賴得,所以還是應(yīng)該選擇“坦白”。也就是說,無論對(duì)方如何選擇,每個(gè)小偷都會(huì)選擇 “坦白”。因此,博弈的結(jié)果就是兩個(gè)小偷都選擇“坦白”。兩個(gè)小偷都選擇“坦白”,這樣的結(jié)果似乎與我們的直覺相矛盾。因?yàn)樵凇扒敉嚼Ь场钡姆N結(jié)果(即、)中,雖說不能肯定這個(gè)結(jié)果是最差的,但它顯然不如。這是因?yàn)閷?dǎo)致兩個(gè)小偷都得,而卻能使大家都得,也就是說,是Pareto優(yōu)于的。既然選擇“抵賴”對(duì)雙方都有好處,那么兩個(gè)小偷是否都會(huì)選擇“抵賴”呢?只要小偷
4、是前面所假設(shè)的完全理性的參與人,答案就是否定的。不妨假設(shè)兩個(gè)小偷都選擇“抵賴”,現(xiàn)在分析小偷的這種選擇是否是理性的。對(duì)小偷1而言,小偷2選擇“抵賴”的情況下,自己選擇“抵賴”得,選擇“坦白”得,顯然“坦白”優(yōu)于“抵賴”。因此,理性的小偷1將會(huì)偏離“抵賴”而選擇“坦白”。基于同樣的原因,理性的小偷2也會(huì)偏離“抵賴”而選擇“坦白”。除了和以外,“囚徒困境”是否會(huì)出現(xiàn)其他結(jié)果呢?比如說一個(gè)人坦白,一個(gè)人抵賴?我們說這樣的結(jié)果也是不會(huì)出現(xiàn)的,因?yàn)樵趯?duì)方選擇“坦白”的情況下,自己選擇“抵賴”顯然是不理性的。剩下的問題是:當(dāng)兩個(gè)小偷都選擇“坦白”時(shí),是否有人偏離“坦白”而選擇“抵賴”。基于同樣的分析,兩個(gè)
5、小偷只要是理性的,這種情況就不會(huì)發(fā)生 也許有人會(huì)問:如果兩個(gè)小偷在被抓之前就制定攻守同盟,決定雙方選擇“抵賴”,這是否可以是博弈的結(jié)果為呢?這要取決于“攻守同盟”對(duì)雙方是否具有約束力,是否對(duì)雙方的支付產(chǎn)生影響。只要這種“攻守同盟”對(duì)雙方的選擇沒有約束力,不能對(duì)違背協(xié)議(即“攻守同盟”)的參與人的支付產(chǎn)生影響,理性的參與人都會(huì)選擇偏離“抵賴”而選擇“坦白”。因此,雖然結(jié)果是結(jié)果的Pareto改進(jìn)(即所有的人都得到好處),但只要兩個(gè)小偷是理性的,這種對(duì)所有人都有好處的“改進(jìn)”兩人都無法得到。這也反映出現(xiàn)實(shí)生活中經(jīng)常出現(xiàn)的“個(gè)人理性與集體理性間的矛盾”。事實(shí)上,“囚徒困境”在現(xiàn)實(shí)生活中有著許多應(yīng)用。
6、也許“囚徒困境”博弈是人們虛構(gòu)出來的一個(gè)博弈模型,但在現(xiàn)實(shí)生活中與“囚徒困境”相似的情形卻很多。例如,寡頭壟斷市場(chǎng)上廠商間的價(jià)格大戰(zhàn),就是典型的“囚徒困境“。20世紀(jì)90年代末期我國出現(xiàn)的彩電企業(yè)間的價(jià)格大戰(zhàn)就是這種情形,還有目前人們議論比較多的有關(guān)中小學(xué)生教育方式的選擇。家長明知道素質(zhì)教育對(duì)孩子的長遠(yuǎn)發(fā)展更有益處,但為了應(yīng)付各種各樣的升學(xué)考試,也不得不讓孩子參與各種名目的“模擬考試”或“考試培訓(xùn)”,這也是典型的“囚徒困境”。諸如此類的例子,現(xiàn)實(shí)生活中還有很多。進(jìn)一步分析“囚徒困境”中小偷的戰(zhàn)略,可以發(fā)現(xiàn)戰(zhàn)略“坦白”具有這樣的特點(diǎn):無論對(duì)方怎樣選擇(選擇“坦白”或者“抵賴”),“坦白”總是理性
7、小偷的最優(yōu)戰(zhàn)略。考察更一般的人博弈情形。人博弈中,參與人的支付既與自己的選擇有關(guān),也與其他參與人的選擇有關(guān)。因此,在一般情況下, 使某參與人的支付最大化的最優(yōu)戰(zhàn)略與其他參與人的選擇有關(guān)。但在某些特殊情況下,如“囚徒困境”博弈中,可能會(huì)出現(xiàn)這樣的情況:參與人的最優(yōu)戰(zhàn)略與其他人參與人的無關(guān)。也就是說,無論其他參與人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略總是唯一的。這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominant strategy),如“囚徒困境”中參與人的“坦白”戰(zhàn)略。定義2-1 在人博弈中,如果對(duì)于所有的其他參與人的選擇,都是參與人的最優(yōu)選擇,即,有則稱為參與人的占優(yōu)戰(zhàn)略。顯然,在一個(gè)博弈問題中,如果某
8、個(gè)參與人具有占優(yōu)戰(zhàn)略,那么只要這個(gè)參與人是理性的,他肯定就會(huì)選擇他的占優(yōu)戰(zhàn)略,參與人的這種選擇行為稱為占優(yōu)行為。占優(yōu)行為是理性參與人選擇行為的最基本特征。【例2-1】 考察圖2-2所示的戰(zhàn)略式博弈,其中參與人1有兩個(gè)戰(zhàn)略和,參與若有四個(gè)戰(zhàn)略和。在參與人2的四個(gè)戰(zhàn)略中,戰(zhàn)略是參與人 2的占優(yōu)戰(zhàn)略。 參與人1 2,1-2,-61,20,13,0-1,23,3-1,-2圖2-2 戰(zhàn)略式博弈參與人2更進(jìn)一步,如果所有的參與人都具有占優(yōu)戰(zhàn)略,那么只要參與人是理性的,肯定都會(huì)選擇自己的占優(yōu)戰(zhàn)略,在這種情況下,博弈的結(jié)果就由參與人的占優(yōu)戰(zhàn)略共同決定。像這種由參與人的占優(yōu)戰(zhàn)略共同決定的博弈結(jié)果,稱為占優(yōu)戰(zhàn)略均衡(dominant-strategy equilibrium)。定義2-2 在人博弈中,如果對(duì)所有參與人,都存在占優(yōu)戰(zhàn)略,則占優(yōu)戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡。顯然,在一個(gè)博弈問題中,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是唯一的所有理性參與人可以預(yù)測(cè)到的博弈結(jié)果。例如,在“新產(chǎn)品開發(fā)博弈”中,當(dāng)市場(chǎng)需求大時(shí),在完全信息靜態(tài)的“新產(chǎn)品開發(fā)博弈”中(見圖1-2),企業(yè)1和2都有占優(yōu)戰(zhàn)略“開發(fā)”,因此博弈的結(jié)果為占優(yōu)戰(zhàn)略均衡(開發(fā),開發(fā)) 顯然,這與我們的直覺是相符的,因?yàn)樵凇笆袌?chǎng)需求”的情況下,企業(yè)只要選擇“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中生涯規(guī)劃與數(shù)學(xué)學(xué)科邏輯推理能力培養(yǎng)研究論文
- 歷史文化遺址保護(hù)教育對(duì)初中生歷史實(shí)踐能力培養(yǎng)的作用研究論文
- 節(jié)能節(jié)水等管理制度
- 英語培訓(xùn)班管理制度
- 茶館俱樂部管理制度
- 低壓成套開關(guān)設(shè)備和控制設(shè)備設(shè)計(jì)規(guī)范書
- 趕集網(wǎng)簡介服務(wù)類-媒體資源網(wǎng)-中國權(quán)威的廣告媒體交易平臺(tái)
- 2025年廣東省深圳市南山第二外國語學(xué)校(集團(tuán))學(xué)府中學(xué)中考數(shù)學(xué)三模試卷
- 綠色卡通插畫綠植奇妙的種子認(rèn)識(shí)種子主題
- 山東省青島市城陽區(qū)2024-2025學(xué)年九年級(jí)下學(xué)期期中歷史試題(含答案)
- 《ptc鈦酸鋇陶瓷》課件
- 氮?dú)獍踩R(shí)培訓(xùn)課件
- 銀發(fā)經(jīng)濟(jì)的發(fā)展路徑
- 金礦融資計(jì)劃書范文
- 2024年11月人力資源管理師三級(jí)真題及答案
- JGJ46-2024 建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)
- 足球場(chǎng)草坪養(yǎng)護(hù)管理手冊(cè)
- 國際私法-001-國開機(jī)考復(fù)習(xí)資料
- 《安全事故案例》課件
- 皮瓣移植護(hù)理個(gè)案
- 基于社交媒體的時(shí)尚品牌營銷策略研究
評(píng)論
0/150
提交評(píng)論