純策略納什均衡_第1頁
純策略納什均衡_第2頁
純策略納什均衡_第3頁
純策略納什均衡_第4頁
純策略納什均衡_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、純策略納什均衡純策略納什均衡(Pure Strategy Nash Equilibrium編輯什么是純策略納什均衡純策略納什均衡 是指在一個純策略組合中,如果給定 其他的策略不變,該節點不會單方面改變自己的策略, 否則不會使節點訪問代價變小。編輯存在純策略納什均衡的有限次重復博弈1如果重復博弈中有惟一純策略納什均衡,那么我 們怎么找出它的純策略納什均衡呢首先看下面囚徒 的困境的博弈的例子:我們現在考慮該博弈重復兩次的重復博弈,這可 以理解成給囚徒兩次坦白機會,最后的得益是兩個階 段博弈中各自得益之和.在兩次博弈過程中,雙方知 道第一次博弈的結果再進行二次博弈用逆推歸納法 來分析,先分析第二階段

2、,也就是第二次重復時兩博弈方的選擇很明顯,這個第二階段仍然是兩囚徒之間的一個囚徒的困境博弈,此時前一階段的結果已成 為既成事實,此后又不再有任何的后續階段,因此實 現自身當前的最大利益是兩博弈方在該階段決策中的 惟一原則因此我們不難得出結論,不管前一次的博弈得到 的結果如何,第二階段的惟一結果就是原博弈惟一的 納什均衡 (坦白,坦白 ),雙方得益 (-5 ,-5)現在再回到第一階段,即第一次博弈理性的博 弈方在第一階段就對后一階段的結局非常清楚,知道 第二階段的結果必然是 (坦白,坦白 ),因此不管第一 階段的博弈結果是什么,雙方在整個重復博弈中的最 終得益,都將是第一階段的基礎上各加 -5

3、因此從第 一階段的選擇來看,這個 重復博弈 與圖 l 中得益矩陣 表示的一次性博弈實際上是完全等價的于是我們可以得出惟一純策略均衡的 有限次重復 博弈的結果就是重復原博弈惟一的純策略納什均衡, 這就是這種重復博弈惟一的 子博弈完美納什均衡 路 徑如果重復博弈中有多個純策略納什均衡,設某一 市場有兩個生產同樣 質量 產品的廠商,他們對產品的 定價同有高(H)、中(M)、低(L)三種可能設高價時市 場總利潤為 10個單位,中價時市場總利潤為 6個單位, 低價時市場總利潤為 2 個單位再假設兩廠商同時決 定價格, 價格不等時低價格者獨享利潤,價格相等時 雙方平分利潤這時候兩廠商對價格的選擇就構成了

4、一個靜態博弈 問題我們看一個三價博弈的重復博弈 的例子:顯然,這個 得益矩陣 有兩個純策略納什均衡 (M, M)和(L, L),我們也可以看出實際上兩博弈方最大的 得益是策略組合(H, H),但是它并不是納什均衡.現 在考慮重復兩次該博弈,我們采用一種 觸發策略 (Trigger Strategy :博弈雙方首先試圖合作,一旦發覺 對方不合作也用不合作相報復的策略.使得在第一階 段采用(H, H)成為子博弈完美納什均衡,其雙方的策 略是這樣的:博弈方1:第一次選H;如果第一次結果為(H, H),則第二次選M,如果第一次結果為任何其他策略 組合,則第二次選擇 L.博弈方 2:同博弈方 1.在上述

5、雙方策略組合下, 兩次重復博弈的路徑一定為第一階段(H, H),第二階 段(M, M),這是一個子博弈完美納什均衡路徑因為第二階段是一個原博弈的納什均衡,因此不可能有哪 一方愿意單獨偏離;其次,第一階段的(H, H)雖然不 是原來的博弈納什均衡,但是如果一方單獨偏離,采 用M能增加1單位得益,這樣的后果卻是第二階段至 少要損失2單位的得益,因為雙方采用的是 觸發策略, 即有報復機制的策略,因此合理的選擇是堅持H.這就說明了上述策略組合是這個兩次重復博弈的 子博弈 完美納什均衡從上述的例子我們可以看出,有多個純策略納什 均衡的博弈重復兩次的子博弈完美納什均衡路徑是, 第一階段采用(H,H),第二

6、階段采用原博弈的納什均 衡(M,M) 如果這個重復博弈重復三次,或者更多次,結論 也是相似的,仍然用觸發策略,它的子博弈完美納什 均衡路徑為除了最后一次以外,每次都采用(H, H), 最后一次采用原博弈的納什均衡(M, M).編輯存在純策略納什均衡的無限次重復博弈1與有限次重復博弈一樣, 無限次重復博弈 也是基 本博弈的簡單重復,但是無限次重復博弈沒有最后一 次重復,因此無限次重復博弈與有限次有一些不同任何博弈中博弈方策略選擇的依據都是得益的大 小,這在重復博弈中仍然是成立的但是重復博弈又 與一次性博弈有所不同,因為在重復博弈中,每一階 段都是一個博弈,并且各博弈方都有得益,因此對于 重復博弈

7、,我們要計算的就是博弈結束時的一個總的 得益由于前一次博弈和后一次博弈之間會有損失, 因此我們采用一種方法,就是將后一階段的得益折算 成當前階段得益的(現在值)的貼現系數,有了貼現系 數6,那么在無限次重復博弈中,某博弈方各階段得 益為n, n,.,則該博弈方總得益的現在值為:對于存在惟一純策略納什均衡博弈的無限次重復 博弈,我們從下面的例子來看:其中博弈方 1和博弈方 2 分別表示兩個廠商, H 和 L 分別表示高價和低價顯然,該博弈的一次性博 弈有惟一的純策略納什均衡(L, L),但是這個納什均 衡并不是最佳策略組合,因為策略組合(H, H)的得益 (4, 4)比(1, 1)要高的多但是由

8、于(H, H)不是該博弈 的納什均衡,所以在一次性博弈中不會被采用根據 上面的分析,此博弈在有限次重復博弈并不能實現潛 在的合作利益,兩博弈方在每次重復中都不會采用效 率較高的(H, H).為了實現效率較高的合作利益(H, H),假設兩博弈方都采用觸發策略,也即報復性策略: 第一階段采用H,在第t階段,如果前t-l階段的結果 都是(H,H),則繼續采用L假設博弈方1已經采用 了這種策略,現在我們來確定博弈方 2在第一階段的 最優選擇如果博弈方2采用L,那么在第一階段能 得到5,但這樣會引起博弈方1 一直采用L的報復, 自己也只能一直米用L,得益將永遠為1,總得益的現 在值為如果博弈方2采用H,則在第一階段他將得4, 下一階段又面臨同樣的選擇若記 V為博弈方2在該 重復博弈中每階段都采用最佳選擇的總得益現在值, 那么從第二階段開始的無限次重復博弈因為與從第一 階段開始的只差一階段,因而在無限次重復時可看作 相同的,其總得益的現在值折算成第一階段的得益為 -,因此當第一階段的最佳選擇是 H時,整個無限 次重復博弈總得益的現在值為F = 4 + 6 x U 或者 1 J因此,當.解得和寸,博弈方2會采用H策略,否則會

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論