




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Chapter3RepeatedGames
Inthischapterweanalyzewhetherthreatsandpromisesaboutfuturebehaviorcaninfluencecurrentbehaviorinrepeatedrelationships.Muchoftheintuitionisgiveninthetwo-periodcase;afewideasrequireaninfinitehorizon.區(qū)分:repeatedgamesandsequentialgames張維迎P207—209Sequentialgame的特征:參與人在前一階段的行動(dòng)選擇決定隨后的子博弈的結(jié)構(gòu),因此,從后一個(gè)決策結(jié)開(kāi)始的子博弈不同于從前一個(gè)決策結(jié)開(kāi)始的子博弈,或者說(shuō),同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。Repeatedgame,顧名思義,就是同樣結(jié)構(gòu)的博弈重復(fù)多次,其中每一次博弈稱為階段博弈Stagegame(也稱為原博弈)。RepeatedGame的基本特征有3項(xiàng):1、階段博弈之間沒(méi)有“物質(zhì)上”的聯(lián)系(noPhysicallinks),也就是說(shuō),前一階段博弈不改變后一階段博弈的結(jié)構(gòu)(對(duì)比之下,序慣博弈涉及到物質(zhì)上的聯(lián)系);2、所有參與人都觀測(cè)到博弈過(guò)去的歷史;3、參與人的總支付是所有階段支付的貼現(xiàn)值之和或加權(quán)平均值。1:階段博弈本身可能是一個(gè)靜態(tài)博弈,也可能是一個(gè)動(dòng)態(tài)博弈。因此重復(fù)博弈可能是不完美信息博弈,也可能是完美信息博弈,盡管博弈論專家談到重復(fù)博弈時(shí)一般是指前一種情況。重復(fù)次數(shù)的重要性來(lái)自于參與人在短期利益和長(zhǎng)期利益之間的權(quán)衡。當(dāng)博弈只進(jìn)行一次,參與人只關(guān)心一次性的支付;但如果博弈重復(fù)多次,參與認(rèn)可能會(huì)為了長(zhǎng)遠(yuǎn)利益而犧牲眼前利益從而選擇不同的均衡策略。這是重復(fù)博弈分析給出的一個(gè)強(qiáng)有力的結(jié)果,它為現(xiàn)實(shí)中觀測(cè)到的許多合作行為和社會(huì)規(guī)范提供了解釋。信息不完備的影響將在下一章討論,這里只討論重復(fù)次數(shù)對(duì)均衡結(jié)果的影響,并假定信息是完備的。一、有限次重復(fù)博弈(以two-stagerepeatedgames為例)考慮曾經(jīng)給出的囚徒困境的標(biāo)準(zhǔn)式(回憶并畫(huà)出支付矩陣)。假設(shè)兩個(gè)參與者要把這樣一個(gè)同時(shí)行動(dòng)博弈重復(fù)兩次,并且在第二次博弈開(kāi)始之前可觀測(cè)第一次的結(jié)果。再假設(shè)整個(gè)過(guò)程博弈的收益等于兩階段各自收益的簡(jiǎn)單相加(即不考慮貼現(xiàn)因素),我們稱這一重復(fù)進(jìn)行的博弈為兩階段囚徒困境。(一)階段博弈只有唯一NE回憶第二章第四節(jié)的“有同時(shí)選擇的兩階段動(dòng)態(tài)博弈”。兩階段囚徒困境其實(shí)屬于這種類型博弈。無(wú)非這里的參與人3、4與參與人1、2是相同的,行動(dòng)空間A3、A4也與A1、A2相同,并且總收益μi(a1,a2,a3,a4)等于第一階段結(jié)果(a1,a2)的收益與第二階段結(jié)果(a3,a4)的收益簡(jiǎn)單相加。在“有同時(shí)選擇的兩階段動(dòng)態(tài)博弈”中第二階段參與人3和4的穩(wěn)定行動(dòng)依賴于第一階段的可行結(jié)果(a1,a2),表示為(a3*(a1,a2),a4*(a1,a2)),而不是簡(jiǎn)單的(a3*,a4*)(關(guān)稅博弈中第二階段企業(yè)的均衡產(chǎn)量依賴于政府第一階段所選擇的關(guān)稅).而在兩階段囚徒困境中,第二階段的NE可以完全不依賴于第一階段的結(jié)果。分析時(shí)要注意3點(diǎn):1逆推歸納法backwards-induction2參與人在第二階段行動(dòng)只須考慮該階段的利益最大化,因?yàn)闊o(wú)須“瞻前顧后”。3分析第一階段時(shí),可把第二階段的均衡結(jié)果下的支付值疊加到第一階段的相應(yīng)支付值上。有限次“囚徒困境”博弈的NE再一次表明了為什么會(huì)爆發(fā)價(jià)格戰(zhàn)。試想兩博弈方不是囚徒而是兩個(gè)大公司,比如可口可樂(lè)公司和百事可樂(lè)公司、或者是聯(lián)合利華公司和寶潔公司,如果擺在這些公司面前的是兩種拓展市場(chǎng)份額策略的選擇:保持原價(jià)或降低價(jià)格,“囚徒困境”博弈告訴我們這些公司會(huì)降低價(jià)格并不斷重復(fù)下去。這個(gè)結(jié)論是令人沮喪的。但實(shí)際情況并非完全如此。那么在什么情況下,它們會(huì)合作呢?羅伯特.艾克斯勞德在著作《合作的演進(jìn)》一書(shū)中描述了一個(gè)計(jì)算機(jī)的競(jìng)賽:選擇14種策略在PropositionIfthestagegameGhasauniqueNashequilibriumthen,foranyfiniteT,therepeatedgameG(T)hasauniquesubgame-perfectoutcome:theNashequilibriumofGisplayedineverystage.注
(二)階段博弈存在兩個(gè)以上NE市場(chǎng)開(kāi)發(fā)博弈。P111借此了解重復(fù)博弈均衡路徑、及其效率比較。*該G重復(fù)兩次構(gòu)成一個(gè)兩階段的重復(fù)博弈,那么可形成多少條路徑?如果不考慮混合策略,16條。其中子博弈完美NE路徑有哪些?從前述的例子中已知,階段博弈的NE在每個(gè)階段的重復(fù)或交替構(gòu)成子博弈完美NE。那么不考慮混合策略NE情況下,有4條。這4條均衡路徑及其支付是:行動(dòng)組合支付向量Stage1Stage2總支付平均支付(A,B)(B,A)(A,B)(B,A)(A,B)(B,A)(2,8)(1,4)(5,5)(2.5,2.5)(5,5)(2.5,2.5)(8,2)(4,1)路徑的支付采用平均支付與采用總支付相比的優(yōu)點(diǎn):平均支付可以與階段博弈的支付相比較。0甲的平均支付乙的平均支付....1231234(1,1)(4,1)(1,4)(3,3)·(2.5,2.5)·(2.67,2.67)*該博弈如果重復(fù)三次構(gòu)成一個(gè)三階段的重復(fù)博弈,由每階段都重復(fù)或交替階段博弈的純策略NE,那么子博弈完美NE路徑有幾條?8條。它們的效率如何?同兩階段重復(fù)博弈。除此之外已找不到另外的效率更高的均衡路徑。但可找到另外一條效率更高均衡路徑。考慮如下面的策略組合:甲:第一階段開(kāi)發(fā)A市場(chǎng);第二階段視第一階段的結(jié)果而定—如果結(jié)果是(A,A),則選A,如果是(A,B),則選B;第三階段無(wú)條件選B。乙:第一階段開(kāi)發(fā)A;第二階段開(kāi)發(fā)B;第三階段根據(jù)第一階段的結(jié)果而定—如果第一階段結(jié)果是(A,A),則選A,否則選B。1、策略中都包含有條件的選擇。2、策略是一個(gè)完整的行動(dòng)方案。問(wèn)題:該策略組合對(duì)應(yīng)的路徑是什么?這就證明了該策略組合是子博弈完美的。從這條均衡路徑中看到:將來(lái)利益對(duì)當(dāng)前的選擇有約束。這種策略有2個(gè)特點(diǎn):1、第一階段選A,試探合作。機(jī)會(huì)主義2、后續(xù)階段中包含著獎(jiǎng)勵(lì)和懲罰機(jī)制:選A可以獎(jiǎng)勵(lì)對(duì)方,選B可以懲罰對(duì)方。因?yàn)椋ˋ,B)和(B,A)都是階段博弈的NE,所以獎(jiǎng)勵(lì)和懲罰都是可信的。一方的機(jī)會(huì)主義行為將觸發(fā)其他參與人策略中的懲罰機(jī)制發(fā)生。觸發(fā)策略(Triggerstrategies):我們把這種包含著獎(jiǎng)勵(lì)和懲罰機(jī)制的策略稱為觸發(fā)策略。正是由于害怕“觸發(fā)”其他參與人的懲罰機(jī)制,所以不敢利用機(jī)會(huì)使自己在該階段利益最大化,從而使該階段的“合作”出現(xiàn)。從這個(gè)意義上看,觸發(fā)策略是“溫柔的”。該階段博弈如果只有兩個(gè)階段,則無(wú)法構(gòu)造觸發(fā)策略(不存在觸發(fā)策略)。上面的例子因?yàn)殡A段博弈的NE很豐富,且存在可供獎(jiǎng)勵(lì)和懲罰的NE,所以雙方不僅可構(gòu)造觸發(fā)策略,而且觸發(fā)策略是子博弈完美的(或者說(shuō)觸發(fā)策略所包含的獎(jiǎng)勵(lì)和懲罰是可信的)。雙方的策略均為:第一階段選擇M;如果第一階段的行動(dòng)組合是(M,X)(或(X,M),X為除M之外的其它可選行動(dòng)),則第二階段選P(Q),如果是除此之外的其它任何組合,則選R。第一階段的行動(dòng)組合是(M,M),則第二階段的行動(dòng)組合將是(R,R);第一階段的行動(dòng)組合是(M,X)或(X,M),則第二階段的行動(dòng)組合將是(P,P)或(Q,Q);第一階段的行動(dòng)組合為其它,則第二階段還是(R,R)。參與人2LMRPQ參與人1L4,45.5,43,33,33,3
M4,5.5
7,7
4,0.5
4,0.54,0.5
R3,30.5,46,63,33,3P3,30.5,43,37,3.53,3Q3,30.5,43,33,33.5,7案例:美國(guó)Staten島上的報(bào)紙發(fā)行市場(chǎng)上有兩個(gè)主要的競(jìng)爭(zhēng)對(duì)手:《紐約郵報(bào)》和《每日新聞》。1994年,《紐約郵報(bào)》所屬公司RubertMurdoch將郵報(bào)的價(jià)格從40美分提高到50美分,這時(shí)《每日新聞》沒(méi)有跟著提價(jià)。在將《紐約郵報(bào)》的價(jià)格降回到40美分之后,對(duì)方還是沒(méi)有作出反應(yīng),于是RubertMurdoch公司宣布有意向?qū)r(jià)格再降到25美分,但對(duì)方仍然沒(méi)有做出響應(yīng)。接著RubertMurdoch公司果然將郵報(bào)在這個(gè)島嶼上的發(fā)行價(jià)格降到25美分。此時(shí),〈每日新聞〉終于明白了〈紐約郵報(bào)〉的意圖,將價(jià)格提高到50每分。不久,RubertMurdoch公司也將價(jià)格重新提高至50美分。〈紐約郵報(bào)〉的策略是友好的,因?yàn)樗婚_(kāi)始就提高價(jià)格;同時(shí)也是挑釁的,在〈每日新聞〉沒(méi)有跟著提價(jià)時(shí),它又將價(jià)格降低;這一策略同樣具有寬恕性,當(dāng)〈每日新聞〉將價(jià)格提高到50美分后,也重新將價(jià)格提高;這一策略也是明了的,〈紐約郵報(bào)〉的意圖對(duì)〈每日新聞〉來(lái)說(shuō)經(jīng)過(guò)了兩個(gè)回合就變得顯而易見(jiàn)。由于“觸發(fā)策略”的運(yùn)用,在這場(chǎng)“囚徒困境”式的價(jià)格博弈中出現(xiàn)了合作雙贏的局面。Murdoch公司的做法和“觸發(fā)策略”的益處在事后看來(lái)更加明顯。Murdoch公司的成功是因?yàn)樗莆樟瞬┺恼摰闹匾瓌t:你要了解競(jìng)爭(zhēng)對(duì)手,也讓競(jìng)爭(zhēng)對(duì)手了解你。因此,如果公司的策略為競(jìng)爭(zhēng)對(duì)手所明白,并且應(yīng)向競(jìng)爭(zhēng)對(duì)手清楚地表明公司準(zhǔn)備合作,但對(duì)背叛行為將采取以牙還牙的報(bào)復(fù)行動(dòng),那么公司最終將贏得競(jìng)爭(zhēng),而競(jìng)爭(zhēng)對(duì)手通過(guò)合作也將大有收獲。引入貼現(xiàn)因子δ,若某個(gè)參與人在某一路徑的各個(gè)階段的支付分別為:π1
、π2
、……,則該參與人在該路徑的“總支付”π為
無(wú)限序列π1
、π2
、……的現(xiàn)值之和,即:
π=π1+δπ2+δ2π3+……=∑
δt-1πt
t=1∞δ?0≤δ≤1當(dāng)δ0,行動(dòng)短視化,時(shí)間視野往往局限于本期、近期;當(dāng)δ1,參與人有遠(yuǎn)見(jiàn),他充分意識(shí)到他現(xiàn)期的行動(dòng)決策將通過(guò)其他參與人的反應(yīng)影響到他未來(lái)的收益,因而試圖跨期協(xié)調(diào)其行動(dòng)決策。無(wú)限次重復(fù)博弈及其支付的定義:DefinitionGivenastagegameG,letG(∞,δ)denotetheinfinitelyrepeatedgameinwhichGisrepeatedforeverandtheplayerssharethediscountfactorδ.Foreacht,theoutcomesofthet-1precedingplaysofthestagegameareobservedbeforethetth
stagebegins.Eachplayer’spayoffintheG(∞,δ)isthepresentvalueoftheplayer’spayoffsfromtheinfinitesequenceofstagegames.現(xiàn)在分析無(wú)限次重復(fù)囚徒困境博弈。我們將證明盡管階段博弈中唯一的NE是不合作的(招認(rèn),招認(rèn)),在有限次重復(fù)時(shí),唯一的子博弈完美NE還是在每個(gè)階段都(招認(rèn),招認(rèn)),可是在無(wú)限次重復(fù)(在可預(yù)見(jiàn)的將來(lái)不會(huì)結(jié)束)進(jìn)行的情況下,只要參與人有足夠的內(nèi)心(即δ足夠接近1),每個(gè)階段的行動(dòng)組合為(沉默,沉默)將形成一條子博弈完美NE的路徑。考慮參與人的觸發(fā)策略:在第一階段選擇不坦白,且在之后的任意階段t,如果之前的(t-1)階段的結(jié)果是雙方都不坦白,則繼續(xù)選擇不坦白,否則從t階段開(kāi)始永遠(yuǎn)選擇坦白。注意:參與人制訂了一個(gè)關(guān)于未來(lái)的無(wú)所不包的行動(dòng)計(jì)劃,即一次性地選擇了函數(shù)形式si(·)作為應(yīng)對(duì)策略,而不是一期只作出依次行動(dòng)選擇。序列5,1,1,……的貼現(xiàn)值之和:5+δ·1+δ2·1+δ3·1+……=5+δ/(1–δ)沉默的現(xiàn)值4/(1-δ)招認(rèn)的現(xiàn)值5+δ/(1–δ)≥δ≥1/4這說(shuō)明,當(dāng)且僅當(dāng)δ≥1/4,給定對(duì)方的觸發(fā)策略并且對(duì)方?jīng)]有首先選擇招認(rèn),自己也不會(huì)首先招認(rèn)。(二)民間定理(無(wú)名氏定理)P125“民間定理”第一段。先明確兩個(gè)關(guān)于支付的概念。平均支付averagepayoff:在無(wú)限次重復(fù)博弈中,平均支付指為了得到相等的支付現(xiàn)值之和而在每一階段都應(yīng)得到的等額支付值。計(jì)算:令貼現(xiàn)因子為δ,那么無(wú)限支付序列π1
、π2
、……的現(xiàn)值之和V為:V=∑
δt-1πt
∞t=1無(wú)限支付序列π、π、……的現(xiàn)值之和V為:V=π+πδ+πδ2+……=π/(1-δ)如果下式成立:∑
δt-1πt∞t=1=π/(1-δ)即:π=(1-δ)∑
δt-1πt∞t=1那么,π就是無(wú)限支付序列π1
、π2
、……的平均支付,它是各階段支付現(xiàn)值之和的(1-δ)倍。可行支付向量feasiblepayoffs:支付數(shù)組x=(x1,x2、…、xn)稱為可行支付向量,如果它是階段博弈G的純策略支付的凸組合(concavecombination)(即xi是階段博弈中參與人i的純策略支付的加權(quán)平均值,權(quán)數(shù)非負(fù)且和為1)。可行支付向量。以“囚徒困境”為例…一個(gè)可行支付向量對(duì)應(yīng)重復(fù)博弈的一條路徑。0囚徒1的支付值囚徒2的支付值1234512345····(1,1)(4,4)(5,0)(0,5)陰影面積中的任意一個(gè)坐標(biāo)點(diǎn)都是一個(gè)可行支付向量。哪些對(duì)應(yīng)著均衡路徑?FolkTheorem(Friedman1971)LetGbeafinite,staticgameofcompleteinformation.Let(e1,e2,……,en)denotethepayoffsfromaNashequilibriumofG,andlet(x1,x2、…、xn)denoteanyotherfeasiblepayoffsfromG.Ifxi>eiforeveryplayeriandifδissufficientlycloseto1,thenthereexistsasubgame-perfectNashequilibriumoftheinfinitelyrepeatedgameG(∞,δ)thatachieves(x1,x2、…、xn)astheaveragepayoff.(P127)例如“囚徒困境”無(wú)限次重復(fù)博弈中…P128Nash威脅點(diǎn)Nashthreatpoint
(e1,e2,……,en)保留支付reservationpayoff:參與人i的保留支付是指無(wú)論其它參與人如何行動(dòng),參與人i能夠保證得到的最大支付;它意味著即使其它參與人試圖給參與人i最大懲罰時(shí),參與人i至少能保證得到的支付。通常以υi表示參與人i的保留支付。
階段博弈囚徒困境中υi=ei=1;階段博弈古諾模型中υi=0,而ei=(a-c)2/9,υi≠ei。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 共享出行平臺(tái)用戶行為與共享汽車租賃市場(chǎng)前景研究報(bào)告
- 共享廚房行業(yè)可持續(xù)發(fā)展報(bào)告:2025年環(huán)保與節(jié)能
- 關(guān)愛(ài)留守兒童工作現(xiàn)狀的調(diào)研報(bào)告
- 西安理工大學(xué)《普通話》2023-2024學(xué)年第一學(xué)期期末試卷
- 四川財(cái)經(jīng)職業(yè)學(xué)院《制圖實(shí)訓(xùn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州電力高等專科學(xué)校《中國(guó)畫(huà)技法Ⅰ》2023-2024學(xué)年第一學(xué)期期末試卷
- 防雷設(shè)施場(chǎng)地租賃安全保護(hù)及責(zé)任劃分協(xié)議
- 股權(quán)激勵(lì)計(jì)劃下部分股權(quán)變更協(xié)議范本
- 美容美發(fā)場(chǎng)地租賃保證金及退賠細(xì)則合同
- 財(cái)務(wù)合同部?jī)?nèi)部審計(jì)與風(fēng)險(xiǎn)控制協(xié)議
- EPC總承包項(xiàng)目中的進(jìn)度控制與資源分配
- 最全看圖猜成語(yǔ) 課件
- 腫瘤中心建設(shè)計(jì)劃書(shū)
- 快題設(shè)計(jì)課件
- 工程居間保密協(xié)議
- 成都市2021級(jí)(2024屆)高中畢業(yè)班第一次診斷性檢測(cè)(一診)英語(yǔ)試卷(含答案)
- 多鐵性材料應(yīng)用
- 住院病歷點(diǎn)評(píng)匯總表
- 壓力容器年度檢查報(bào)告(模板直接打印)
- 摩登家庭第一季臺(tái)詞中英對(duì)照
- 社會(huì)經(jīng)濟(jì)咨詢服務(wù)合同范本
評(píng)論
0/150
提交評(píng)論