博弈論與經濟模型第7章_第1頁
博弈論與經濟模型第7章_第2頁
博弈論與經濟模型第7章_第3頁
博弈論與經濟模型第7章_第4頁
博弈論與經濟模型第7章_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

??#?注:在某些文獻中,只允許用純戰略定義最小最大值(Osborne&Rubinstein,1994)。也許這會導致一個較高的保留水平。因此,在我們當前的例子里,保留水平v二1andv二1。對付121的最小最大組合是L或R;對付2的最小最大組合是D。注意,在這種情形,可行集,嚴格個人理性收入都是空集。無名氏定理“無名氏定理”(folktheorem)又被稱為“一般可行性定理”(generalfeasibilitytheorem),它被Friedman(1971)給出正式的證明之前就被人們廣為所知。無名氏定理的一種表述是:對于每一個嚴格個人理性的veV,存在某個§e(0,1),使得對于所有的§w(5,1),存在G的一8個納什或子博弈完美均衡,其支付向量為V。但是,這需要局中人采用相關戰略,由于某些博弈結果的支付的凸組合不能通過獨立的隨機選擇期望支付得到。根據Fudenbergan和Maskin(1986),我們假定在每一個時期的開始所有的局中人都能夠根據一個公開的隨機性裝置產生的隨機性結果來選擇他們的戰略。設(3,3,...)是從一個[0,1]上的均勻分布隨機變量中獨立抽取的一個序列,并且假定局中人在時期t的開始就公開地觀察到了3t。此時,時期t的歷史就是:ht二(a1,,at-1,31,,3t)并且一個戰略是從歷史ht到A的一系列映射。為了明確我們的思路,考慮第2章中的例2.2i中給出的性別戰博弈,支付向量(3/2,3/2)并不能從1和2所選擇的任何混合戰略(p,1-p)和(q,1-q)導出。然而,它卻可以從一個相關戰略里導出來,使得(足球,足球)和(芭蕾,芭蕾)各自以一半的時間出現。因此,為了獲得這個期望收入組合,公開的隨機性裝置就應該分別以1/2的概率選擇信號1和2。并且規定每個局中人在看到信號1時選擇F,在看到信號2時選擇B。(j解決這個問題的另外一種方法是在子博弈完美均衡的合作階段的描述中允許戰略循環)Fudenberg與Maskin(1991)后來證明這個假定并非必需的。納什無名氏定理定理7.1(納什無名氏定理)對于每一個嚴格個人理性的veV,存在某個(0,1),使得對于所有的§e(8,1),存在G的一個納什均衡,其支付向量為v。8證明:首先假定存在aeA使得u(a)=v。設Proof.u-v§二max丄i—ieNU.-V1~i我們指出下述戰略形成G的一個納什均衡,8廠

at二1或ht-1二(a,a,...,a)

s(傷).甘宀.mj,其匕J?i_如果局中人i首先在時期t從其s偏離,他在此時期獲得一個最大的u.=maxu(a)并且iiai

在隨后只得到v.,因此總的收入為I_(1—8t)v+8t(1—8)u.+8vvv。iL.一i」i由于有8>8。如果命題里要達到的v不能通過純戰略來生成,則對于所有的t=1,2,……,存在一個公開的隨機信號wt和一個戰略a(wt),使得V二E[u(a(wt))」。那么,我們來考慮下面的戰略組合a(wJ,t=1或ht—i=(a(wi),...,a(wt—1),()t)TOC\o"1-5"\h\zs(ht)=<.T=1.[mj,其它i設_u—u8=max.ii6NU,—v+v—U.一ii_i—i收入流為ai(1—8)u+8vL_iv(1—8)u.+8v其中u=minu(a),再一次,如果局中人i首先在時期t從其s偏離,他獲得一個最大的<(1—8)u(a(wt))+8vi—i=v對于8>8成立。注意,上述戰略是以一種毫不饒恕或者說是冷酷的方式對偏離進行懲罰的,因此執行這樣的懲罰對于懲罰者來說是具有高昂的成本的。由于懲罰出現在均衡歷史之外,對于納什無名氏定理來說不會帶來什么問題。但是,然而,這些戰略可能不是子博弈完美的。被稱之為納什威脅無名氏定理(Nashthreatsfolktheorem)的一個早期的無名氏定理克服了這個困難,它是通過用階段博弈的納什均衡收入對偏離者加以懲罰來做到這一點的。7.4.4完美無名氏定理定理7.2(Friedman1971)設?*eN(G)滿足u(a*)=e。則對于任意滿足v>e,igN的iiveV,存在8e(0,1)使得對于所有的8e(8,1),存在G,勺一個收入為V的子博弈完美納什均8衡。證明:假定存在aeA滿足u(a)=v,并且考慮下列的戰略組合。在時期1,每個人都選擇a,并且只要ht=(a,a,……,a)就繼續選擇a。倘若至少有一個局中人偏離,則每一個局中人iii都在余下的博弈中選擇a*。選擇滿足下列條件的8:i(1—8)u+8evviii它保證該戰略組合對于所有8e(8,1)都是子博弈完美的。如果不存在滿足u(a)=v的aeA,則就象在納什無名氏定理中那樣使用公開隨機信號。然而,該定理能夠證明獲得僅僅是可行的和嚴格個人理性收入的一個有限的部分作為子博弈完美均衡是可能的,因為階段博弈的納什均衡收入一般來說是大于最小最大收入的。定理7.3:(Aumann與Shapley1976)如果用平均準則,則對于滿足v>v,igN的任意1—i的VgV,存在G的一個收入為V的子博弈完美納什均衡。O證明:考慮下列戰略:在“合作階段”開始。在這個階段,進行一個收入為V的公開隨機性博弈p,并且只要沒有偏離就繼續保持這個階段。如果局中人i偏離就在N個階段選擇最小最大戰略mi=(mi,mi),其中N滿足i—imaxg(a)+Nv<ming(a)+Nvi~iiiaa對于所有的局中人i成立。當N個時期過去后,不管對于mi有無偏離都回到合作階段。回憶一下,單方面偏離性質并不適用于有平均準則的無限次博弈(要加以討論)。因此,為了驗證這些戰略是完美均衡,我們必須證明在任何子博弈上都不存在能夠改進一個局中人收入的戰略。N所滿足的條件保證從合作階段中產生偏離所獲得的任何收益都會在隨后的懲罰階段里被損失掉,所以,沒有任何有限或者無限次偏離的序列能夠把局中人i的平均收入增加到v之i上。還有,即使對一個偏離者進行最小最大懲罰按照單期支付來看是高成本的,任何有限數量的這種損失從平均準則看卻是低成本的。所以,在局中人i被懲罰的子博弈中,局中人j的平均收入是v,并且在任何子博弈中沒有局中人j能夠通過偏離而獲利。因此,這些戰略是子博弈j完美的。這個證明是依賴于這樣一個事實,即由于懲罰者在一個有限期中因為執行懲罰而具有較低的支付,他會因為平均準則極限而不能感受到成本的存在。在有折現的情況下,就不會是這樣的了,并且在懲罰階段里必須找到一種方式去阻止來自懲罰者的有利可圖的偏離行為。能夠做到這一點的一種方法是當懲罰者執行了特定的懲罰行動后給予他們一定的獎賞。然而,此時,必須要小心不要也同時獎賞了原有的偏離者了。否則,局中人就會僅僅為了在隨后得到獎賞而試圖偏離從而進入懲罰階段。這就需要可行集要足夠大,使得我們能夠在為一個局中人提供獎賞時不會獎勵另外的局中人。Fudenberg與Maskin(1986)曾為此給出了一個充分條件所謂的“滿秩條件”(thefulldimensionalitycondition),即dimV=n定理7.4:(Fudenberg與Maskin,1986)如果dimV=n,則對于每一個嚴格個人理性的VgV,存在某個°g(0,1)使得對于所有的0g(°,1),存在G的一個收入為V的子博弈完美納什均衡。一°證明:我們假定存在滿足u(a)二V的agA并且對于每一個局中人i的最小最大組合mi是—i純戰略。后一假定保證了在懲罰階段的偏離一定能夠被發現。一般情形在Fudenberg與Maskin(1986,1991)中得到證明。設v'gint(V)滿足:對于每一個i,有v<vr<viii由于V是滿秩的,故存在一個8>0使得v'(i)二(v'+£,v'+8,V'+8,V'+8,,V'+8)GVTOC\o"1-5"\h\z1i+1ii+1n再一次為了避免公開隨機信號的細節,我們假定存在a(i)gA滿足g(a(i))二V(i)。設wj二u(mj)是當對局中人j的最小最大組合被實施時局中人i的收入。設N滿足iiu(i)+Nv<u+Nv'(7.2)iiii(這就保證了在折現因子足夠接近于1的情況下,一旦偏離并且在N個時期里被其他局中人施以最小最大懲罰時比起只獲得最小收入并且在N個時期里得到V'要糟糕一些。i下列戰略組合是子博弈完美的。階段I:選擇a。只要在階段I或者實現了的行動是a或者實現了的行動在兩個或更多分量上不同于a,就繼續保持選擇在階段I中。如果有單個的局中人j偏離a,則博弈進入階段II。階段II:在每個階段選擇mj。只要在每個階段或者實現的行動是m或者實現的行動在兩個或更多分量上不同于m,就繼續在階段II中N個時期。在N個接連不斷保持階段II的時期之后轉入階段III。如果在階段II中有單個的局中人i的行動不同于mj,則開始II。。jjii階段III:選擇a(j),并且繼續這樣做除非在某個時期有單個局中人i不選擇a(j)。如果ji有一個局中人i偏離,則開始階段II。i我們現在來通過單方面偏離性質驗證子博弈完美性質。在階段I,局中人i通過遵守規則而獲得V。通過偏離,他最多獲得i(1-6)u+6(1-6n)v+6N+1*'i~ii它在6充分大時是小于v的。i在階段III,j豐i,局中人i通過遵守規則獲得v'+8。在一次性偏離中他的收入最多為ji(1-6)u+6(1-6n)v+6n+1v'iii它在6充分大時是小于v'+8的。i在階段III,局中人i通過遵守規則而獲得v'且通過一次性偏離至多得到ii(1-6)u+6(1-6n)v+6N+1v'iii由(7.2),這并不是一個有利可圖的偏離。在階段II,jhi,當階段II還有N,個時期時,局中人i通過遵守規則獲得:jj(1-6n')wj+6n'(v'+8)ii倘若他偏離,他最多會獲得(1-6)u+6(1-6n)v+6n+1v'iii當6充分大時,這并不是有利可圖的。當階段II還有N,個時期時,如果局中人i在階段II遵守規則,他會獲得iiq(N')二(1-6n')v+6n'v'iii如果他一次性地偏離,他最多會獲得

(1-6)v+6q(N)<q(N)<q(N')ii1i由于有v'>v,于是就完成了證明。ii7.5廠商為何提供高質量產品:一個重復博弈解說對于大多數產品來說,消費者在購買時是難一下子判斷出產品的質量好壞的。如果廠商提供的產品存在質量問題,往往要待消費者使用之后才會發現。當然,一旦消費者在使用產品后發現產品存在質量問題,往往可以通過訴諸法律的方式指控廠商,如果廠商預期到生產低質量產品可能會招致起訴,他們就會注重產品的質量管理,從而盡量減少產品中的低質量比例。但是,許多消費者即使事后發現所購買的產品存在質量問題,也不一定會起訴,因為起訴存在成本。所以,對廠商的產品質量管理產生約束機制的還不僅限于潛在的起訴可能性,我們在本小節將表明,如果廠商關注長期利益,他們與消費者之間進行的是無限次重復博弈,則存在長期的合作均衡即廠商總是生產高質量產品的均衡。這里,我們構造一個簡單的模型來加以說明。這個模型也是無名氏定理的一個簡單應用,不過,與前面的模型不同的是,這里我們將無名氏定理擴展到一部分局中人不固定的重復博弈情形。假定有一個廠商是長期的固定局中人,他不斷重復性地提供產品;但消費者是不固定的,每一階段有一個消費者只買一次。這樣,模型的基本假設是,一個無限次重復博弈的局中人由一個固定的廠商和無限個不同的消費者(也可以一部分消費者是相同的,如同一位消費者在不同的階段決定買與不買)。廠商在每個階段決定是生產一單位高質量的產品呢還是生產低質量的產品,而每一個階段有唯一的一個消費者面臨是否購買一單位產品的抉擇。假定消費者在購買時不知道自己買的產品的質量,但知道所有之前的消費者購買的產品質量。如果消費者不買,他的收入為0;如果買到高質量產品,其收入為1;如果買到的是低質量產品,他的收入就為-1。廠商賣出高質量產品,其收入為1,但若賣出低質量產品,支付就為2。這里所說的收入都是指階段收入。表7.4給出了這個博弈的階段博弈收入或者支付矩陣。表7.4產品質量博弈消費者1,1-1,20,0消費者1,1-1,20,00,0廠商買不買高質量低質量如果是一次性博弈,則只有一個納什均衡(不買,低質量),這對應于走街串巷的小販們難以取得人們信任的情形。因為游走于街坊之間的小販們知道即使賣低質量產品坑蒙大家,人們也不一定會在事后抓住他,因為他下一次不會再走同樣的路線,這就激勵小販們兜售低質量產品。給定小販們的這種戰略,理性的消費者是不愿購買游販們的產品的。理性消費者更愿意到大商場或坐攤上買東西,為什么呢?這是由于大商場明天不會不見了,坐攤一般也會長期在同一個地方賣產品,于是,如果買回來的產品存在質量問題,明天還可以去找他們索賠。給定這一戰略,廠商若要把生意長期做下去,就不會提供低質量產品,而給定廠商提供高質量產品,消費者就會買。下面,我們來證明這是一個完美均衡。設廠商執行的戰略是:開始生產高質量產品,繼續生產高質量產品,除非曾經生產過低質量產品;如果上一次生產了低質量產品,之后永遠生產低質量產品。消費者的戰略是,第一階段的消費者決定買;只要廠商不曾生產過低質量產品,隨后階段的消費者繼續買;如果廠商曾經生產過低質量產品,之后的消費者不再買。顯然,這些戰略實際上是冷酷戰略。給定消費者戰略,當廠商生產低質量產品時,得到2單位短期收入,但之后每階段支付為0;若廠商總是生產高質量產品,每階段收入為1,貼現后總收入為1/(1-6),其中5為廠商的貼現因子。當1/(1-5)>2或5>1/2時,廠商就會總生產高質量產品。所以,若之前不曾生產低質量產品,廠商的最優選擇是繼續生產高質量產品。如果之前曾生產低質量產品,給定消費者戰略,之后消費者不再買,破罐子破摔地繼續生產低質量產品是最優的。這樣,當廠商具有足夠的長期利益關注時(即5足夠大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論