




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五講:“開金礦開金礦”博弈博弈完全完全且完美信息動態(tài)博弈的求解且完美信息動態(tài)博弈的求解1“靜態(tài)博弈”與“動態(tài)博弈”在靜態(tài)博弈中,所有參與人同時行動(或者,行動有先后,但沒有人在自己行動之前觀測到別人的行動);在動態(tài)博弈中,參與人的行動有先后順序,后行動者在自己行動之前能觀測到先行動者的行動。2Dynamic games are the ones where the timing of decision making plays a role.3靜態(tài)博弈戰(zhàn)略式表述(Strategic Form Representation)動態(tài)博弈擴展式表述(Extensive Form Representa
2、tion)4戰(zhàn)略式表述(Strategic Form Representation)(1)參與人集合;(2)每個參與人的戰(zhàn)略集合;(3)由戰(zhàn)略組合決定的每個參與人的支付。5擴展式表述(Extensive Form Representation)1.參與人集合;2.參與人的行動順序(the order of moves);3.參與人的行動空間(action set);4.參與人的信息集(Information set);5.參與人的支付函數(shù);6.外生事件(自然的選擇)的概率分布。6博弈矩陣兩人有限戰(zhàn)略博弈的戰(zhàn)略式表述。博弈樹n人有限戰(zhàn)略博弈的擴展式表述。7ContentsContents1.“1
3、.“開金礦博弈開金礦博弈”問題的描述問題的描述2.2.有法律保障的有法律保障的“開金礦博弈開金礦博弈”3.3.法律保障不足的開金礦博弈法律保障不足的開金礦博弈4.4.相機選擇與策略中的可信性問題相機選擇與策略中的可信性問題5.5.逆推歸納法逆推歸納法6.6.子博弈子博弈7.7.子博弈完美納什均衡子博弈完美納什均衡81.“1.“開金礦博弈開金礦博弈”問題的描述問題的描述9“開金礦博弈開金礦博弈”問題問題甲在開采一價值甲在開采一價值4 4千萬元的金礦時缺千萬元的金礦時缺1 1千萬元資千萬元資金,而乙正好有金,而乙正好有1 1千萬元資金可以投資。假設(shè)千萬元資金可以投資。假設(shè)甲想說服乙將這甲想說服乙將
4、這1 1千萬元資金借給自己用于開千萬元資金借給自己用于開礦,并允諾在采到金子后與乙對半分成,乙是礦,并允諾在采到金子后與乙對半分成,乙是否該將錢借給甲呢?否該將錢借給甲呢?假設(shè)金礦的價值是經(jīng)過權(quán)威部門探測認(rèn)定的,假設(shè)金礦的價值是經(jīng)過權(quán)威部門探測認(rèn)定的,沒必要懷疑,則乙最需要關(guān)心的就是甲采到金沒必要懷疑,則乙最需要關(guān)心的就是甲采到金子后是否會履行諾言跟自己平分,因為萬一甲子后是否會履行諾言跟自己平分,因為萬一甲采到金子后不但不跟乙平分,而且還賴帳或卷采到金子后不但不跟乙平分,而且還賴帳或卷款潛逃,乙會連自己的本錢都收不回來。款潛逃,乙會連自己的本錢都收不回來。10“開金礦博弈開金礦博弈”問題問題
5、的擴展式表述的擴展式表述11乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)博弈樹給出了有限博弈的幾乎所有信息。 博弈樹的基本建筑材料(basic building block): 結(jié)(node) 枝(branch) 信息集(Information set)12乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)博弈樹的基本建筑材料(basic building block)結(jié)(node)包括“決策結(jié)”和“終點結(jié)”“決策結(jié)(decision node)”:參與人采取行動的時點。“終點結(jié)(terminal node)”:博弈
6、行動路徑的終點。13乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)博弈樹的基本建筑材料(basic building block)枝(branch) 在博弈樹上,“枝”是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線(有時用箭頭表述),每一個枝代表參與人的一個行動選擇。14乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)博弈樹的基本建筑材料(basic building block)信息集(Information set) 博弈樹上的所有決策結(jié)分割成不同的信息集。每個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策
7、結(jié): (1)每一個決策結(jié)都是同一參與人的決策結(jié); (2)該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié)。15乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)博弈樹的基本建筑材料(basic building block) 信息集(Information set) 引入信息集的目的是描述下列情況: 當(dāng)一個參與人要做出決策時他可能并不知道“之前”發(fā)生的所有事情。16乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)完美信息博弈(game of perfect information) 一個信息集可能
8、包含多個決策結(jié),也可能包含一個決策結(jié)。只包含一個決策結(jié)的信息集稱為“單結(jié)(singleton)信息集”。如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為“完美信息博弈( game of perfect information )”。 完美信息博弈意味著博弈中沒有任何兩個參與人同時行動,并且所有后行動者能確切知道前行動者選擇了什么行動,所有參與人觀測到自然的行動。17乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)分析博弈問題時的一般假設(shè)博弈方都是以自身利益(得益)最大化為目的,即他們不考慮道德因素,除非能把道德因素折算成數(shù)量化的效用綜合進得益中。18乙乙甲甲借
9、借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)“開金礦博弈開金礦博弈”問題的分析問題的分析 【結(jié)論結(jié)論】:甲在第二階段選擇甲在第二階段選擇 “ “不分不分”; 乙在第一階段選擇乙在第一階段選擇“不借不借” ” 。19乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)對乙來說,對乙來說,本博弈中甲本博弈中甲有一個有一個“不不可信可信”的允的允諾。諾。 20乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)信任?“什么叫信心?當(dāng)一個小孩子被父母什么叫信心?當(dāng)一個小孩子被父母拋向空中,他在空中咯咯地
10、笑,這就拋向空中,他在空中咯咯地笑,這就是信心。什么叫信靠?當(dāng)一個小孩子是信心。什么叫信靠?當(dāng)一個小孩子看到可怕的怪物,立即撲向父母的懷看到可怕的怪物,立即撲向父母的懷中,這就是信靠。中,這就是信靠。”21有限博弈如果一個擴展式表述博弈有有限個信息集,每個信息集上參與人有有限個行動選擇,我們說這個博弈是有限博弈。22乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)有限完美信息博弈定理(Zermelo,1913;Kuhn,1953):一個有限完美信息博弈有一個純策略納什均衡。23乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4
11、 4) 由于有不可信的允諾,使得甲、乙的合作最終成為由于有不可信的允諾,使得甲、乙的合作最終成為不可能,這不是最佳結(jié)局。不可能,這不是最佳結(jié)局。 那么,有沒有辦法使甲的允諾變成可信的,從而使那么,有沒有辦法使甲的允諾變成可信的,從而使乙愿意選擇乙愿意選擇“借借”,然后甲遵守諾言選擇,然后甲遵守諾言選擇“分分”,最終增加雙方的利益呢?最終增加雙方的利益呢?24乙乙甲甲借借不借不借(1 1,0 0)(2 2,2 2)分分不分不分(0 0,4 4)2.2.有法律保障的有法律保障的“開金礦博弈開金礦博弈”25有法律保障的有法律保障的“開金礦博弈開金礦博弈” 如果讓乙在甲違約時可以用法律武器,如果讓乙在
12、甲違約時可以用法律武器,即即“打官司打官司”來保護自己的利益,則來保護自己的利益,則情況會有所不同。情況會有所不同。 26(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況下,甲分析表明,在乙的利益受到法律保障的情況下,甲的的“分分”錢允諾變成可信的會信守的允諾。錢允諾變成可信的會信守的允諾。27(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打有法律保障的有法律保障的
13、“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況下,甲的分析表明,在乙的利益受到法律保障的情況下,甲的“分分”錢允諾變成可信的會信守的允諾。錢允諾變成可信的會信守的允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的選擇。最終就成了合理的選擇。最終結(jié)果是乙在第一階段選擇結(jié)果是乙在第一階段選擇“借借”,甲在第二階段選擇,甲在第二階段選擇“分分”,從而博弈結(jié)束,雙方各得,從而博弈結(jié)束,雙方各得2 2千萬元。千萬元。28(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打有法律保障的有法律保障的“開金
14、礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況分析表明,在乙的利益受到法律保障的情況下,甲的下,甲的“分分”錢允諾變成可信的會信守的錢允諾變成可信的會信守的允諾。允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的就成了合理的選擇。最終結(jié)果是乙在第一階段選擇選擇。最終結(jié)果是乙在第一階段選擇“借借”,甲在第二階段選擇甲在第二階段選擇“分分”,從而博弈結(jié)束,從而博弈結(jié)束,雙方各得雙方各得2 2千萬元。千萬元。 此時,乙的完整策略是此時,乙的完整策略是“第一階段選擇第一階段選擇借借,若第二階段甲選擇,若第二階段甲選擇不分不分,第三,第三階段選擇階段選擇打打”,甲的完整策略
15、是,甲的完整策略是“第二第二階段選擇階段選擇分分”。29有法律保障的有法律保障的“開金礦博弈開金礦博弈” 分析表明,在乙的利益受到法律保障的情況分析表明,在乙的利益受到法律保障的情況下,甲的下,甲的“分分”錢允諾變成可信的會信守的錢允諾變成可信的會信守的允諾。允諾。 這樣,乙第一階段選擇這樣,乙第一階段選擇“借借”就成了合理的就成了合理的選擇。最終結(jié)果是乙在第一階段選擇選擇。最終結(jié)果是乙在第一階段選擇“借借”,甲在第二階段選擇甲在第二階段選擇“分分”,從而博弈結(jié)束,從而博弈結(jié)束,雙方各得雙方各得2 2千萬元。千萬元。 此時,乙的完整策略是此時,乙的完整策略是“第一階段選擇第一階段選擇借借,若第
16、二階段甲選擇,若第二階段甲選擇不分不分,第三,第三階段選擇階段選擇打打”,甲的完整策略是,甲的完整策略是“第二第二階段選擇階段選擇分分”。 這就是這個三階段動態(tài)博弈的解。這就是這個三階段動態(tài)博弈的解。3031(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打 在一個由都有私心、都重視自身利益的成員所組成的社會中,完善公正的法律制度不但能夠保障社會的公平,而且還能提高社會經(jīng)濟活動的效率,是實現(xiàn)最優(yōu)效率的社會分工合作的重要保障。32要充分保障社會公平和經(jīng)濟效率,法律制度必須要滿足兩方面的要求:一是,對守法者有足夠的保護力度;二是
17、,對違法者有足夠的震懾作用。333.3.法律保障不足的開金礦博弈法律保障不足的開金礦博弈34法律保障不足的開金礦法律保障不足的開金礦博弈博弈 分析表明:乙在第三階段選擇分析表明:乙在第三階段選擇“打打”官司的威脅不是官司的威脅不是可信的,而是一種可信的,而是一種“不可信的(不可信的(incredibleincredible)” “” “空空頭威脅(頭威脅(empty threatempty threat)”。所以乙在第一階段選擇。所以乙在第一階段選擇“不借不借”。 35(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打4.4
18、.相機選擇與策略中的可信性問題相機選擇與策略中的可信性問題36 通過開金礦博弈的幾個不同版本,我們清楚通過開金礦博弈的幾個不同版本,我們清楚了在動態(tài)博弈中,各個博弈方的選擇和博弈了在動態(tài)博弈中,各個博弈方的選擇和博弈的結(jié)果,與各個博弈方在各個階段選擇各種的結(jié)果,與各個博弈方在各個階段選擇各種行為的可信程度有很大關(guān)系。行為的可信程度有很大關(guān)系。37可信性問題是動態(tài)博弈分析中的一個中心問題 有時候,雖然有些博弈方很想或聲稱要采取某種行動,但是如果這些行動缺乏以經(jīng)濟利益為基礎(chǔ)的可信性,那么這些想法或聲明最終就不會有真正的效力,就只能落空。38通過開金礦博弈的幾個不同版本,說通過開金礦博弈的幾個不同版
19、本,說明了動態(tài)博弈中的明了動態(tài)博弈中的相機選擇相機選擇引出的可引出的可信性問題,以及可信性在動態(tài)博弈分信性問題,以及可信性在動態(tài)博弈分析中的關(guān)鍵意義。析中的關(guān)鍵意義。39動態(tài)博弈中的策略動態(tài)博弈中的策略動態(tài)博弈中博弈方的策略是他們自己動態(tài)博弈中博弈方的策略是他們自己預(yù)先設(shè)定的,在各個博弈階段,針對預(yù)先設(shè)定的,在各個博弈階段,針對各種情況的相應(yīng)行為選擇的計劃。各種情況的相應(yīng)行為選擇的計劃。40動態(tài)博弈中的動態(tài)博弈中的“相機選擇相機選擇” ” 問題問題動態(tài)博弈中博弈方的策略實際上并沒動態(tài)博弈中博弈方的策略實際上并沒有強制力,而且實施起來有一個過程,有強制力,而且實施起來有一個過程,因此只要符合博弈
20、方自己的利益,他因此只要符合博弈方自己的利益,他們完全可以在博弈過程中改變計劃。們完全可以在博弈過程中改變計劃。我們稱這種問題為動態(tài)博弈中的我們稱這種問題為動態(tài)博弈中的“相機選相機選擇擇”(contingent playcontingent play)問題。)問題。41策略中的策略中的“可信性可信性”問題問題 相機選擇的存在使得博弈方的策略中,所設(shè)相機選擇的存在使得博弈方的策略中,所設(shè)定的各個階段、各種情況下會采取行為的定的各個階段、各種情況下會采取行為的“可信性可信性”(credibilitycredibility)有了疑問。)有了疑問。 也就是說,各個博弈方是否會真正、始終按也就是說,各個
21、博弈方是否會真正、始終按照自己的策略所設(shè)定的方案行為,還是可能照自己的策略所設(shè)定的方案行為,還是可能臨時改變自己的行動方案呢?臨時改變自己的行動方案呢? 不同版本的開金礦博弈給出了實際案例。42相機選擇與策略中的可信性問題相機選擇與策略中的可信性問題由于動態(tài)博弈中博弈方的策略是多階由于動態(tài)博弈中博弈方的策略是多階段的行動計劃,實施起來有一個過程,段的行動計劃,實施起來有一個過程,而且又沒有強制力,因此博弈方完全而且又沒有強制力,因此博弈方完全可以在博弈過程中改變計劃,我們稱可以在博弈過程中改變計劃,我們稱這種問題為這種問題為“相機選擇相機選擇”問題。問題。相機選擇的存在使得動態(tài)博弈中各博相機選
22、擇的存在使得動態(tài)博弈中各博弈方策略設(shè)定的行為選擇的弈方策略設(shè)定的行為選擇的“可信性可信性”有了疑問。有了疑問。43“破釜沉舟”完全承諾(Total commitment)445.5.逆推歸納法逆推歸納法45逆推歸納法逆推歸納法 我們前面引入我們前面引入“可信性可信性”問題時,對不同版問題時,對不同版本的本的“開金礦博弈開金礦博弈”問題的分析結(jié)論都是正問題的分析結(jié)論都是正確的,對博弈方的選擇和博弈結(jié)果都做出了確的,對博弈方的選擇和博弈結(jié)果都做出了正確的判斷,都排除了博弈方不可信的行為正確的判斷,都排除了博弈方不可信的行為選擇。選擇。 之所以能做到這一點,根本原因是采用了一之所以能做到這一點,根本
23、原因是采用了一種分析動態(tài)博弈的有效方法種分析動態(tài)博弈的有效方法“逆推歸納逆推歸納法法”(Backwards InductionBackwards Induction)。)。 這種方法的表現(xiàn)形式為:從動態(tài)博弈的最后這種方法的表現(xiàn)形式為:從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段。到第一個階段。46法律保障不足的開金礦博弈法律保障不足的開金礦博弈第一步第一步:分析:分析第三第三階段乙是否打官司階段乙是否打官司的選擇,由于的選擇,由于“打打”官司比官司比“不打不打
24、”官官司損失更大,他必司損失更大,他必然會選擇然會選擇“不打不打”官司。官司。47(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第一步第一步:分析:分析第三階第三階段乙是否打官司的選段乙是否打官司的選擇,由于擇,由于“打打”官司官司比比“不打不打”官司損失官司損失更大,他必然會選擇更大,他必然會選擇“不打不打”官司。官司。 因此一旦博弈進行到因此一旦博弈進行到這個階段,結(jié)果必然這個階段,結(jié)果必然是乙選擇是乙選擇“不打不打”官官司,雙方得益為(司,雙方得益為(0 0,4 4
25、)。48(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第一步:分析第三階段第一步:分析第三階段乙是否打官司的選擇,乙是否打官司的選擇,由于由于“打打”官司比官司比“不不打打”官司損失更大,他官司損失更大,他必然會選擇必然會選擇“不打不打”官官司。司。 因此一旦博弈進行到這因此一旦博弈進行到這個階段,結(jié)果必然是乙個階段,結(jié)果必然是乙選擇選擇“不打不打”官司,雙官司,雙方得益為(方得益為(0 0,4 4)。)。 所以在分析前兩個階段所以在分析前兩個階段的博弈時,原來的三階的博
26、弈時,原來的三階段博弈與下頁的兩階段段博弈與下頁的兩階段博弈是完全等價的。博弈是完全等價的。49(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打法律保障不足的開金礦博弈法律保障不足的開金礦博弈 第二步:第二步:繼續(xù)繼續(xù)對該兩階段博弈對該兩階段博弈運用逆推歸納法,運用逆推歸納法,可知甲在第二階可知甲在第二階段選擇段選擇“不分不分”,因此博弈可進一因此博弈可進一步化為下頁的等步化為下頁的等價博弈。價博弈。50(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)法律保障不足的開金礦博弈法律保障不
27、足的開金礦博弈 第三步:第三步:這個等價這個等價博弈已經(jīng)是一個單博弈已經(jīng)是一個單人博弈了,可知乙人博弈了,可知乙將選擇將選擇“不借不借”。 51乙乙借借不借不借(1 1,0 0)(0 0,4 4)逆推歸納法逆推歸納法事實上就是把多階段動態(tài)博弈轉(zhuǎn)化為一系列的單人博弈,通過對一系列單人博弈的分析,確定各博弈方在各自階段的選擇,最終對動態(tài)博弈結(jié)果(包括,博弈的路徑、各博弈方的得益)做出綜合判斷,歸納出各博弈方各階段的選擇,從而得出各博弈方在整個動態(tài)博弈中的策略。52逆推歸納法逆推歸納法逆推歸納法確定的各個博弈方在各階逆推歸納法確定的各個博弈方在各階段的選擇,都是建立在后續(xù)階段各個段的選擇,都是建立在
28、后續(xù)階段各個博弈方理性選擇基礎(chǔ)上的,因此自然博弈方理性選擇基礎(chǔ)上的,因此自然排除了包含不可信的威脅或允諾的可排除了包含不可信的威脅或允諾的可能性,因此它得出的結(jié)論是比較可靠能性,因此它得出的結(jié)論是比較可靠的,確定的各個博弈方的策略組合是的,確定的各個博弈方的策略組合是有穩(wěn)定性的。有穩(wěn)定性的。53逆推歸納法逆推歸納法是在動態(tài)博弈分析中使用得最普遍的方法,在分析完全且完美信息動態(tài)博弈中非常有用。54逆推歸納法的邏輯基礎(chǔ)逆推歸納法的邏輯基礎(chǔ) 動態(tài)博弈中先行為的理性的博弈方,在前面動態(tài)博弈中先行為的理性的博弈方,在前面階段選擇行為時必須會先考慮后行為博弈方階段選擇行為時必須會先考慮后行為博弈方在后面階
29、段中將會怎樣選擇行為,只有在博在后面階段中將會怎樣選擇行為,只有在博弈的最后一個階段選擇的,不再有后繼階段弈的最后一個階段選擇的,不再有后繼階段牽制的博弈方,才能直接做出明確選擇。牽制的博弈方,才能直接做出明確選擇。 而當(dāng)后面階段博弈方的選擇確定以后,前一而當(dāng)后面階段博弈方的選擇確定以后,前一階段博弈方的行為也就容易確定了。階段博弈方的行為也就容易確定了。55逆推歸納法的一般方法逆推歸納法的一般方法 從動態(tài)博弈的最后一個階段開始分析,每一從動態(tài)博弈的最后一個階段開始分析,每一次確定出所分析階段博弈方的選擇和路徑,次確定出所分析階段博弈方的選擇和路徑,然后再確定前一個階段的博弈方選擇和路徑。然后
30、再確定前一個階段的博弈方選擇和路徑。逆推歸納到某個階段,那么這個階段及以后逆推歸納到某個階段,那么這個階段及以后的博弈結(jié)果就可以肯定下來,該階段的選擇的博弈結(jié)果就可以肯定下來,該階段的選擇節(jié)點等于一個結(jié)束終端。節(jié)點等于一個結(jié)束終端。 我們可以用不包含該階段與其后所有階段博我們可以用不包含該階段與其后所有階段博弈的等價博弈來代替原來的博弈。弈的等價博弈來代替原來的博弈。566.6.子博弈子博弈(Subgame) 子博弈是動態(tài)博弈分析中一個非常關(guān)鍵的概子博弈是動態(tài)博弈分析中一個非常關(guān)鍵的概念,它是動態(tài)博弈中滿足一定條件的局部所念,它是動態(tài)博弈中滿足一定條件的局部所構(gòu)成的次級博弈構(gòu)成的次級博弈。57
31、子博弈(子博弈(SubgameSubgame)的定義)的定義由一個動態(tài)博弈第一階段以外的某階由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進行博弈所需要的全部信始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個部分,稱為原動態(tài)博弈的一個“子博子博弈弈”。58 定義:一個擴展式表述博弈的子博弈G由一個決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)(包括終點結(jié))組成,它滿足下列條件: (1)x是一個單結(jié)信息集,即包含決策結(jié)x的信息集h(x)=x; (2)對于所有的xT(x),
32、如果x” h(x),那么x” T(x)。59法律法律保障不足的開金礦保障不足的開金礦博弈博弈 如果乙在第一階段選擇了如果乙在第一階段選擇了“借借”,意味著這個動態(tài)博弈,意味著這個動態(tài)博弈進行到了甲作選擇的第二階段。此時甲面臨的是一個在進行到了甲作選擇的第二階段。此時甲面臨的是一個在乙已經(jīng)借錢給他的前提下,自己選擇是否分成,然后再乙已經(jīng)借錢給他的前提下,自己選擇是否分成,然后再由乙選擇是否打官司的兩階段動態(tài)博弈問題。由乙選擇是否打官司的兩階段動態(tài)博弈問題。60(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打法律保障不足的開金
33、礦博弈法律保障不足的開金礦博弈 按照子博弈的定義,在前頁介紹的子博弈中,當(dāng)甲選按照子博弈的定義,在前頁介紹的子博弈中,當(dāng)甲選擇擇“不分不分”,輪到乙選擇,輪到乙選擇“打打”還是還是“不打不打”的第三的第三階段,是前頁介紹的子博弈的子博弈,我們稱后面這階段,是前頁介紹的子博弈的子博弈,我們稱后面這個子博弈為原博弈的個子博弈為原博弈的“二級子博弈二級子博弈”。 61(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打子博弈(子博弈(續(xù)續(xù)) 一般地,當(dāng)動態(tài)博弈的階段數(shù)更多時,還可能存在更一般地,當(dāng)動態(tài)博弈的階段數(shù)更多時,還可能存在更
34、多層次的子博弈。多層次的子博弈。 62(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打子博弈(子博弈(續(xù)續(xù)) 子博弈在動態(tài)博弈中是很普遍的,完美信息多階子博弈在動態(tài)博弈中是很普遍的,完美信息多階段動態(tài)博弈基本上都有一級或多級子博弈。段動態(tài)博弈基本上都有一級或多級子博弈。63(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打子博弈(子博弈(續(xù)續(xù)) 并不是動態(tài)博弈的任何部分都能構(gòu)成子博弈。并不是動態(tài)博弈的任何部分都能構(gòu)成子博弈。子博弈不能包括原博弈的第一階段
35、。子博弈不能包括原博弈的第一階段。 并不是所有多階段動態(tài)博弈都有子博弈。并不是所有多階段動態(tài)博弈都有子博弈。在不完美信息動態(tài)博弈中可能不存在子博弈。在不完美信息動態(tài)博弈中可能不存在子博弈。647.7.子博弈完美納什均衡(子博弈完美納什均衡(Subgame Subgame Perfect Nash equilibriumPerfect Nash equilibrium) 65 在動態(tài)博弈分析中,納什均衡不能排除不可信的行為選擇,不是真正具有穩(wěn)定性的均衡概念,因此需要發(fā)展出一個新的均衡概念,它能排除不可信的行為選擇。66子博弈完美納什均衡的定義子博弈完美納什均衡的定義 如果在一個完美信息的動態(tài)博弈
36、中,各博弈如果在一個完美信息的動態(tài)博弈中,各博弈方的策略構(gòu)成的一個策略組合滿足,在整個方的策略構(gòu)成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一衡,那么這個策略組合稱為該動態(tài)博弈的一個個“子博弈完美納什均衡子博弈完美納什均衡”(Subgame Perfect Nash Equilibrium)。)。67子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù))提出提出“子博弈完美納什均衡子博弈完美納什均衡”這個概這個概念的價值在于它能夠排除納什均衡策念的價值在于它能夠排除納什均衡策略中不可信的威脅或承諾,因此它是
37、略中不可信的威脅或承諾,因此它是真正穩(wěn)定的。真正穩(wěn)定的。68子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) “子博弈完美納什均衡子博弈完美納什均衡”為什么能夠排除策為什么能夠排除策略組合中的不可信行為呢?略組合中的不可信行為呢? 雖然包含不可信行為選擇的策略組合可以構(gòu)成整個雖然包含不可信行為選擇的策略組合可以構(gòu)成整個博弈的納什均衡,但其中的不可信行為選擇至少在博弈的納什均衡,但其中的不可信行為選擇至少在博弈的某些子博弈中不符合博弈方的自身利益,因博弈的某些子博弈中不符合博弈方的自身利益,因而不構(gòu)成這些子博弈的納什均衡,而不構(gòu)成這些子博弈的納什均衡, 因此要求在所有子博弈中都是納什均衡的子博弈完
38、因此要求在所有子博弈中都是納什均衡的子博弈完美納什均衡就排除了其中存在不可信行為選擇的策美納什均衡就排除了其中存在不可信行為選擇的策略組合,從而在動態(tài)博弈分析中具有真正的穩(wěn)定性。略組合,從而在動態(tài)博弈分析中具有真正的穩(wěn)定性。69子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 雙方的策略組合雙方的策略組合“乙第一階段選乙第一階段選擇擇借借,第三階段選擇,第三階段選擇打打;甲第二階段選擇甲第二階段選擇分分”是整個是整個博弈的一個納什均衡。博弈的一個納什均衡。 但是,這個策略組合中乙的策略但是,這個策略組合中乙的策略要求乙在第三階段單人博弈構(gòu)成要求乙在第三階段單人博弈構(gòu)成的子博弈中選擇的子博弈中選擇
39、“打打”,不是該,不是該子博弈的一個納什均衡,因此根子博弈的一個納什均衡,因此根據(jù)子博弈完美納什均衡的定義判據(jù)子博弈完美納什均衡的定義判斷,這個策略組合確實不是一個斷,這個策略組合確實不是一個子博弈完美納什均衡。子博弈完美納什均衡。 這也正是上述納什均衡策略組合這也正是上述納什均衡策略組合不穩(wěn)定的根源。不穩(wěn)定的根源。70(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 策略組合策略組合“乙在第一階段選乙在第一階段選擇擇不借不借,如果有第三階段,如果有第三階段選擇則選選擇則選不打
40、不打;甲如果有;甲如果有第二階段則選第二階段則選不分不分” ” 是是子博弈完美納什均衡。子博弈完美納什均衡。因為該策略組合的雙方策略不僅因為該策略組合的雙方策略不僅在整個博弈中構(gòu)成納什均衡,而在整個博弈中構(gòu)成納什均衡,而且在兩級子博弈中也都構(gòu)成納什且在兩級子博弈中也都構(gòu)成納什均衡,從而不存在任何不可信的均衡,從而不存在任何不可信的威脅或承諾,根據(jù)子博弈完美納威脅或承諾,根據(jù)子博弈完美納什均衡的定義,該策略組合構(gòu)成什均衡的定義,該策略組合構(gòu)成這個動態(tài)博弈的一個子博弈完美這個動態(tài)博弈的一個子博弈完美納什均衡納什均衡。71(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,
41、4 4)乙乙(1 1,0 0)打打不打不打子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 當(dāng)兩博弈方按照子博當(dāng)兩博弈方按照子博弈完美納什均衡策略弈完美納什均衡策略組合組合“乙在第一階段乙在第一階段選擇選擇不借不借,如果,如果有第三階段選擇則選有第三階段選擇則選不打不打;甲如果有;甲如果有第二階段則選第二階段則選不不分分”行為時,實際行為時,實際上不會進行到博弈的上不會進行到博弈的第二、第三階段,兩第二、第三階段,兩個博弈方在第二、第個博弈方在第二、第三階段的行為實際上三階段的行為實際上不會發(fā)生。不會發(fā)生。72(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分不分不分(0 0,4 4)
42、乙乙(1 1,0 0)打打不打不打子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 我們稱此時第二階段甲的選擇節(jié)我們稱此時第二階段甲的選擇節(jié)點和第三階段乙的選擇節(jié)點為點和第三階段乙的選擇節(jié)點為“不在均衡路徑上不在均衡路徑上”(out-of-out-of-equilibrium pathequilibrium path;off-off-equilibrium equilibrium path path )的,兩博弈)的,兩博弈方的策略中在這兩個節(jié)點的選擇方的策略中在這兩個節(jié)點的選擇稱為稱為“不在均衡路徑上的選擇不在均衡路徑上的選擇”。73(2 2,2 2)乙乙甲甲借借不借不借(1 1,0 0)分分
43、不分不分(0 0,4 4)乙乙(1 1,0 0)打打不打不打子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 一個子博弈完美納什均衡必須對博弈方在所有選擇節(jié)點處的一個子博弈完美納什均衡必須對博弈方在所有選擇節(jié)點處的選擇做出規(guī)定,包括最終不在均衡路徑上的節(jié)點,而且不管選擇做出規(guī)定,包括最終不在均衡路徑上的節(jié)點,而且不管是在均衡路徑上的選擇還是不在均衡路徑上的選擇,都必須是在均衡路徑上的選擇還是不在均衡路徑上的選擇,都必須在相應(yīng)子博弈中構(gòu)成納什均衡,不能包含任何不可信的威脅在相應(yīng)子博弈中構(gòu)成納什均衡,不能包含任何不可信的威脅或承諾,否則就不能保證一個策略組合是子博弈完美納什均或承諾,否則就不能保證一
44、個策略組合是子博弈完美納什均衡。衡。74“在每一個子博弈上給出納什均衡在每一個子博弈上給出納什均衡” 構(gòu)成子博弈精煉納什均衡的戰(zhàn)略不僅在均衡路徑的決策結(jié)上最優(yōu),而且在非均衡路徑的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精煉納什均衡的實質(zhì)區(qū)別所在。 這里的要義是,戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(每一個決策結(jié)上)選擇什么行動,即使這種情況實際上并沒有發(fā)生(甚至參與人并不預(yù)測它會發(fā)生),因此,只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的時,它才是一個合理的、可置信的戰(zhàn)略。(張張維迎,維迎,2012,第,第99頁頁)75“序貫理性” (sequenti
45、al rationality) 子博弈精煉納什均衡就是剔除那些只有在特定情況下是合理的而在其他情況下并不合理的行動規(guī)則。 博弈論專家常常使用“序貫理性”(sequential rationality)指不論過去發(fā)生了什么,參與人在博弈的每一個時點上最優(yōu)化自己的決策。子博弈精煉納什均衡要求的正是參與人應(yīng)該是序貫理性的。(張維迎,張維迎,2012,第,第99頁頁)76子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù)) 子博弈完美納什均衡本身也是納什均衡,是子博弈完美納什均衡本身也是納什均衡,是比納什均衡更強的均衡概念。比納什均衡更強的均衡概念。 澤爾澤爾騰(騰(SeltenSelten,1965196
46、5)引入)引入“子博弈精煉納什均子博弈精煉納什均衡(衡(Subgame Perfect Nash EquilibriumSubgame Perfect Nash Equilibrium)”概念概念的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給動態(tài)博弈結(jié)果一個合理預(yù)測。從均衡中剔除,從而給動態(tài)博弈結(jié)果一個合理預(yù)測。簡單地說,簡單地說,子博弈精煉納什子博弈精煉納什均衡要求均衡戰(zhàn)略的行均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上都是最優(yōu)的。為規(guī)則在每一個信息集上都是最優(yōu)的。(張維迎,2012,第96頁)77子博弈完美納什均衡(子博弈完美納什
47、均衡(續(xù)續(xù)) 子博弈完美納什均衡在動態(tài)博弈分析中的地子博弈完美納什均衡在動態(tài)博弈分析中的地位與納什均衡在靜態(tài)博弈分析中一樣,是最位與納什均衡在靜態(tài)博弈分析中一樣,是最核心的分析概念和基本著眼點。核心的分析概念和基本著眼點。 要對動態(tài)博弈做出有效的分析,首先必須找出它們要對動態(tài)博弈做出有效的分析,首先必須找出它們的子博弈完美納什均衡,必須判斷一個策略組合是的子博弈完美納什均衡,必須判斷一個策略組合是不是子博弈完美納什均衡。不是子博弈完美納什均衡。78子博弈完美納什均衡(子博弈完美納什均衡(續(xù)續(xù))求完美信息動態(tài)博弈的求完美信息動態(tài)博弈的“子博弈完美納什均子博弈完美納什均衡衡”最基本的方法就是最基本的方法就是逆推歸納法逆推歸納法:引進子博弈和子博弈完美納什均衡之后,逆推引進子博弈和子博弈完美納什均衡之后,逆推歸納法事實上可以理解為:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年機電一體化專業(yè)考試試題及答案
- 2025年環(huán)境藝術(shù)設(shè)計專業(yè)答辯試卷及答案
- 2025年多元文化教育專業(yè)考試試卷及答案
- 物資采購供貨管理制度
- 特殊群體品牌管理制度
- 特殊設(shè)備安全管理制度
- 特色小鎮(zhèn)開發(fā)管理制度
- 特許經(jīng)營合同管理制度
- 獵頭業(yè)務(wù)過程管理制度
- 豬場冬季物料管理制度
- 保潔學(xué)校管理制度
- 2025年河北省中考麒麟卷生物(三)及答案
- 2025年河北省中考麒麟卷生物(二)及答案
- 2025年中國鐵路濟南局集團招聘筆試沖刺題(帶答案解析)
- 2025年河北省萬唯中考定心卷地理(二)
- 2025年高考全國二卷英語高考真題含解析
- 2025年全國高考一卷英語真題(解析版)
- 湖南省長沙市2025年七年級下學(xué)期語文期末試卷(附參考答案)
- 農(nóng)機停放場管理制度
- 2025年浙江省嘉興市南湖區(qū)中考二模英語試題(含答案無聽力原文及音頻)
- T/SHPTA 071.1-2023高壓電纜附件用橡膠材料第1部分:絕緣橡膠材料
評論
0/150
提交評論