




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 重復(fù)博弈 本章介紹基本博弈重復(fù)進(jìn)行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進(jìn)行,但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡(jiǎn)單重復(fù),因?yàn)椴┺姆綄?duì)于博弈會(huì)重復(fù)進(jìn)行的意識(shí),會(huì)使他們對(duì)利益的判斷發(fā)生變化,從而使他們?cè)谥貜?fù)博弈過(guò)程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡(jiǎn)單疊加,必須把整個(gè)重復(fù)博弈過(guò)程作為整體進(jìn)行研究。本章分三節(jié)4.1 重復(fù)博弈引論4.2 有限次重復(fù)博弈4.3 無(wú)限次重復(fù)博弈4.1 重復(fù)博弈引論4.1.1 為何研究重復(fù)博弈4.1.2 基本概念4.1.1 為何研究重復(fù)博弈n經(jīng)濟(jì)中的長(zhǎng)期關(guān)系n人們的預(yù)見(jiàn)性n未來(lái)利益對(duì)當(dāng)前行為的制約n長(zhǎng)期合同、回頭客、
2、長(zhǎng)客和一次性買(mǎi)賣的區(qū)別n有無(wú)確定的結(jié)束時(shí)間4.1.2 基本概念n有限次重復(fù)博弈有限次重復(fù)博弈:給定一個(gè)基本博弈G(可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈),重復(fù)進(jìn)行T次G,并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過(guò)程稱為“G的T次重復(fù)博弈”,記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個(gè)“階段”。n無(wú)限次重復(fù)博弈無(wú)限次重復(fù)博弈:一個(gè)基本博弈G一直重復(fù)博弈下去的博弈,記為G( )n策略策略:博弈方在每個(gè)階段針對(duì)每種情況如何行為的計(jì)劃n子博弈子博弈:從某個(gè)階段(不包括第一階段)開(kāi)始,包括此后所有的重復(fù)博弈部分n均衡路徑均衡路徑:由每個(gè)階段博弈
3、方的行為組合串聯(lián)而成重復(fù)博弈的得益的平均得益為相同的現(xiàn)在值,則稱得益序列階段的得益,能產(chǎn)生與無(wú)限次重復(fù)博弈)各個(gè)重復(fù)博弈或作為重復(fù)博弈(有限次:如果一常數(shù),,2121平均得益11)1 (ttt慮貼現(xiàn)問(wèn)題無(wú)限次重復(fù)博弈必須考考慮貼現(xiàn)因素有限次重復(fù)博弈不一定4.2 有限次重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)博弈4.2.2唯一純策略納什均衡博弈 的有限次重復(fù)博弈4.2.3多個(gè)純策略納什均衡博弈 的有限次重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理4.2.1 兩人零和博弈的有限次重復(fù)博弈n零和博弈是嚴(yán)格競(jìng)爭(zhēng)的,重復(fù)博弈并不改變這一點(diǎn)。n以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)
4、博弈一樣,博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。4.2.2唯一純策略納什均衡博弈的 有限次重復(fù)博弈n定理定理:設(shè)原博弈G有唯一的純策略納什均衡,則對(duì)任意整數(shù)T,重復(fù)博弈 G(T)有唯 一的子博弈完美納什均衡,即各博弈方每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍,平均得益的與原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈100,10020,150150,20
5、70,70高 價(jià)低 價(jià)高價(jià)低價(jià)寡頭寡頭2寡寡頭頭1削價(jià)競(jìng)爭(zhēng)博弈有唯一純策略納什均衡(70,70)有限次重復(fù)的結(jié)果仍然是(低價(jià),低價(jià))4.2.3多個(gè)純策略納什均衡博弈的 有限次重復(fù)博弈5,53,32,00,22,06,00,20,61,1HMH廠商廠商2ML廠廠商商1L三價(jià)博弈2,23,13,11,34,47,11,31,78,8廠廠商商1廠商廠商2LMHHML兩次重復(fù)三價(jià)博弈的等價(jià)模型觸發(fā)策略觸發(fā)策略:兩博弈方先試探合作,一旦發(fā)現(xiàn)對(duì)方不合作則也用不合作報(bào)復(fù)博弈方1:第一次選h;如第一次結(jié)果為(H,H),則第二次選M,否則選L博弈方2:同博弈方1兩市場(chǎng)博弈的重復(fù)博弈(重復(fù)兩次)n(A,B)+(A
6、,B) OR (B,A)+(B,A)(1,4)(4,1)n連續(xù)兩次采用混合策略(2,2)n(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)輪換策略n一次純策略+一次混合策略(1.5,3)(3,1.5)0,04,11,33,3廠廠商商1廠商廠商2BAAB兩市場(chǎng)博弈重復(fù)博弈不同策略、均衡及一次性博弈得益比較n不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)(1.5,3)4.2.4 有限次重復(fù)博弈的民間定理n個(gè)體理性得益?zhèn)€體理性得益:不管其它博弈方的行為如何,一博弈方在某個(gè)博弈中只要自己采取某種特定的策略,最
7、低限度保證能獲得的得益n可實(shí)現(xiàn)得益可實(shí)現(xiàn)得益:博弈中所有純策略組合得益的加權(quán)平均數(shù)組n定理定理:設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在該博弈的多次重復(fù)中所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益,都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 無(wú)限次重復(fù)博弈4.3.1 兩人零和博弈的無(wú)限次重復(fù)博弈4.3.2 唯一純策略納什均衡博弈 的無(wú)限次重復(fù)博弈4.3.3 無(wú)限次重復(fù)古諾模型4.3.4 有效工資率4.3.1 兩人零和博弈的無(wú)限次重復(fù)博弈n兩人零和博弈無(wú)限次重復(fù)的所有階段都不可能發(fā)生合作,博弈方會(huì)一直重
8、復(fù)原博弈的混合策略納什均衡4.3.2唯一純策略納什均衡博弈 的無(wú)限次重復(fù)博弈兩寡頭削價(jià)競(jìng)爭(zhēng)博弈 該博弈一次性博弈均衡是都采用低價(jià),是囚徒困境型博弈4,40,55,01,1HLHL無(wú)限次重復(fù)兩寡頭削價(jià)博弈 觸發(fā)策略觸發(fā)策略:第一階段采用H,如果前t-1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。 如果博弈方2采用L,總得益現(xiàn)值為 如果博弈方2采用H,總得益現(xiàn)值為 因此當(dāng) 時(shí),此觸發(fā)策略納什均衡策略151152VV 44/1兩寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民間定理廠商2得益廠商1得益(1,4)(3,3)(1,1)(4,1)(5,0)(5,0),(),(1),(),(11niininxxGie
9、xGxxGeeG均得益為什均衡,各博弈方的平完美納中一定存在一個(gè)子博弈次重復(fù)博弈,那么無(wú)限足夠接近都成立,而對(duì)任意博弈方果的任意可實(shí)現(xiàn)得益。如表示用的納什均衡的得益,記的靜態(tài)博弈。用是一個(gè)完全信息理:設(shè)無(wú)限次重復(fù)博弈民間定4.3.3 無(wú)限次重復(fù)古諾模型 假定假定: ,邊際成本都為2。 在無(wú)限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率 滿足一定條件時(shí),兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡: 在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第 t 階段,如果前 t-1 階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量2。 21,8qqQQP其中 設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策
10、略,則每期得益4.5,無(wú)限次重復(fù)博弈總得益的現(xiàn)值為: 如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時(shí),自己的最大利潤(rùn)產(chǎn)量,即滿足: 解得 ,此時(shí)利潤(rùn)為5.0625,高于觸發(fā)策略第一階段得益4.5。15 . 415 . 4222225 . 4max25 . 18max222qqqqqqq25. 22q 但從第二階段開(kāi)始,廠商1將報(bào)復(fù)性地永遠(yuǎn)采用古諾產(chǎn)量2,這樣廠商2也被迫永遠(yuǎn)采用古諾產(chǎn)量,從此得利潤(rùn)4。因此,無(wú)限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為: 當(dāng) 上述策略是廠商2對(duì)廠商1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。 140625. 540625.
11、 52179140625. 515 . 4即4.3.4 有效工資率模型設(shè)定模型設(shè)定: 首先廠商選擇工資率為 ,然后工人選擇接受或拒絕。如果拒絕,則他作個(gè)體戶得到收入 小于 ,如果接受 ,則工人選擇努力工作(負(fù)效用 )還是偷懶(無(wú)負(fù)效用)。 廠商只能看到產(chǎn)量高低,高產(chǎn)量為 ,低產(chǎn)量0。 工人努力工作時(shí)一定是高產(chǎn)量 ,不努力時(shí)卻并不一定是0,而是高產(chǎn)量 的概率為 ,低產(chǎn)量0的概率為 。 工人努力工作時(shí),廠商得益為 ,工人得益為 ; 工人偷懶時(shí),廠商期望得益為 ,工人得益為 。w0wwwe0yyypp1wy ewwpy 0w考慮如下的觸發(fā)策略考慮如下的觸發(fā)策略: 廠商在第一階段給工資率 ,在第t階段
12、,如果前面t-1階段結(jié)果都是 則繼續(xù)給 ,否則從此永遠(yuǎn)是 。 工人的策略是如果 則接受,否則寧愿作個(gè)體戶得到 ,并在以前各期結(jié)果都是 和當(dāng)前工資率為 時(shí)努力工作,否則偷懶。 設(shè)廠商已采用上述觸發(fā)策略。由于 ,工人接受工作是最佳反應(yīng)。用 記工人努力工作時(shí)無(wú)限次重復(fù)博弈得益的現(xiàn)值,則 即*w),(*yw*w0w0ww 0w),(*yw*w0*ww eVeeVewV)(*)1 ()(*ewVe 用 記工人選偷懶時(shí)無(wú)限重復(fù)博弈得益的現(xiàn)值,則: 即 因此當(dāng) 即時(shí),努力是工人的最佳選擇。 反過(guò)來(lái),設(shè)工人已采用上述觸發(fā)策略。若廠商給的工資率滿足上式條件,并且威脅一旦產(chǎn)量降低就解雇工人,則各階段的得益為 ,無(wú)限次重復(fù)博弈得益現(xiàn)值為 。若不愿給 ,則解雇工人,以后得益為0。因此只要 ,廠商選擇前述觸發(fā)策略就是最佳反應(yīng)。 sV)1)1 (0*wppVwVss)1 ( )1 ()1 ()1 (0*pwpwVsseVV epeweppww)1 (1)1 (10
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025文具用品采購(gòu)合同范本簡(jiǎn)化版
- 初中血型鑒定題目及答案
- 初中挑戰(zhàn)高中題目及答案
- 2025官方版確保借款合同模板
- 川農(nóng)獸醫(yī)自考試題庫(kù)及答案
- 2025合同模板委托辦理保險(xiǎn)服務(wù)合同范本
- 2025筆記本電腦購(gòu)銷合同范本
- 2025私人居間合同個(gè)人之間的協(xié)議
- 初中信息科技考試試題及答案
- 初中基礎(chǔ)考試試題及答案
- 阿米巴模式的合同協(xié)議書(shū)
- 技術(shù)員獎(jiǎng)勵(lì)協(xié)議書(shū)
- 北京市先農(nóng)壇體育運(yùn)動(dòng)技術(shù)學(xué)校招聘筆試真題2024
- GB 35181-2025重大火災(zāi)隱患判定規(guī)則
- 打破傳統(tǒng)藩籬:小學(xué)高段先寫(xiě)后教習(xí)作教學(xué)模式的創(chuàng)新與實(shí)踐
- 2025年道德與法治課程考試試卷及答案
- 天津2025年中國(guó)醫(yī)學(xué)科學(xué)院放射醫(yī)學(xué)研究所第一批招聘筆試歷年參考題庫(kù)附帶答案詳解
- 中國(guó)科學(xué)院大學(xué)《高級(jí)人工智能》2023-2024學(xué)年第一學(xué)期期末試卷
- 華南理工大學(xué)自主招生綜合素質(zhì)評(píng)價(jià)面試及試題指導(dǎo)
- 不飽和聚酯樹(shù)脂化學(xué)品安全技術(shù)說(shuō)明書(shū)MSDS
- 《白內(nèi)障》PPT課件.ppt
評(píng)論
0/150
提交評(píng)論