{教育管理}完全信息靜態信息博弈納什均衡優品_第1頁
{教育管理}完全信息靜態信息博弈納什均衡優品_第2頁
{教育管理}完全信息靜態信息博弈納什均衡優品_第3頁
{教育管理}完全信息靜態信息博弈納什均衡優品_第4頁
{教育管理}完全信息靜態信息博弈納什均衡優品_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、教育管理完全信息靜態信息博弈納什均衡卓越精品管理案例您可以自由騙事,值得悠下我擁有?混合策略與期望支付?計算混合策略納什均衡的三種方 法?支付最大值法?支付等值法?反應函數法?多重納什均衡及其甑別純策略(pure strategies):如果 一個策略規定參與人在一個給定 的信息情況下只選擇一種特定的 行動。混合策略(mixed strategies):如果一個策略規定參與人在給定 的信息情況下,以某種概率分布 隨機地選擇不同的行動。與混合策略(mixed strategies) 相伴 隨的一個問題,是局中人支付的不確 定性(uncertainty).可用期望支付 (expected payo

2、ff)來描述有個n可能的取值X1,X2,Xn ,并且這些 取值發生的概率分別為p1,p2,pn ,p整一一夕”.同 pnm1望值定義為發生概率作為權重的所 有可能取值的加權平均,也就是?政府想幫助流浪漢,但前提是后者必須試圖尋找 工作,否則,不予幫助;而流浪漢若知道政府采 用救濟策略的話,他就不會尋找工作。他們只有 在得不到政府救濟時才會尋找工作。他們獲得的 支付如圖所示:救濟政府(3, 2)(-1, 3)(-1, D(0, 0)流浪漢尋找工作游閑不救濟?思考:政府會采用純策略嗎?流 浪漢呢?這個博弈有沒有純策略 的納什均衡??那么政府和流浪漢最有可能采用 什么策略??使自己的預期支付最大化。

3、求解混合策略納什均衡1、假定政府采用混合策略:G,1即政府以的概率選擇救濟,1的概率選擇不救濟。2、流浪漢的混合策略為:L ,1即流浪漢以的概率選擇m找工作,1的概率選擇游閑流浪漢3,2-1 , 3-1 , 10,0找工作 游蕩政 救濟不救濟假設政府救濟的概率為;流浪漢找工作的概率為則政府的期望效用函數為:uG31 110 1uG31 110151對上述效用函數求微分,得到政府最優化的一階條 件為:-uG 5100.2就是說,從政府的最優化條件找到流浪漢混 合策略一一流浪漢以0.2的概率選擇尋找工作,0 .8 的概率選擇游閑。流浪漢3,2-1 , 3-1 , 10,0找工作 游蕩政 救濟不救濟

4、假設政府救濟的概率為 ;流浪漢找工作的概率為 則流浪漢的期望效用函數為:uL21 1130 1(21) 3?流浪漢的期望效用函數為:uL 21 1130 1(21) 3Ul0.5maxuG3(1)(1)()maxuL2(1)3(1)則 0.5,0.2?政府選擇不救濟策略0期望效用uG 0,10 1解二:支付等值法?政府選擇救濟策略 1期望效用Ug 1,31 141如果一個混合策略是流浪漢的最優選擇,那一定意味 著政府在救濟與不救濟之間是無差異的,即:Ug 1,41Ug 0,0.23,2-1 , 3-1 , 10,0如果一個混合策略是政府的最優選擇, 那一定意味著流浪漢在尋茗工作與 游閑之間是無

5、差異的,找彈“艮/游蕩政 救濟 府 不救濟uL 1,13 uL 0,0.5?如果政府救濟的概率小于0.5;?則流浪漢的最優選擇是尋找工 作;?如果政府救濟的概率大于0.5;?則流浪漢的最優選擇是游閑等 待救濟。?如果政府財話的概未正好笑干?上面的均衡要求每個參與人以特定的概率選擇純 策略。也就是說,一個參與人選擇不同策略的概 率不是由他自己的支付決定的,而是由他的對手 的支付決定的。?正是由于這個原因,許多人認為混合策略納什均 衡是一個難以令人滿意的概念。?事實上,正是因為它在幾個(或全部)策略之間 是無差異的,他的行為才難以預測,混合策略納 什均衡才會存在。討論?盡管混合策略不像純策略那樣直

6、觀,但它確實是 一些博弈中參與人的合理行為方式。撲克比賽、 壘球比賽、劃拳就是這樣的例子,在這一類博弈 中,參與比賽的總是隨機行動以使自己的行為不 被對方所預測。?經濟學上的監督博弈也是這樣一個例子。如 稅收 檢查、質量檢查、懲治犯罪、雇主監督雇員等都 可以看成猜謎博弈。§撲克牌對色游戲?AB玩撲克牌對色游戲,每人都 有紅黑兩張撲克牌,約定如果出 牌顏色一樣,A輸B贏,如果出 牌顏色不一樣,則A贏B輸。B-1 , 11 , -11, -1-1 , 1?找到這個博弈的納什均衡溪.里八、例撲克牌對色游戲紅-1 , 11 , -1里 八、1 , -1-1 , 1紅假設A出紅牌的概率為p;

7、b出紅牌的概率為q;則UA(P,q) 2p(12q) (2q 1)因此A的最佳反應函數為0,當q 1/2P 0,1,當 q 1/21,當q 1/2P 410同理UB(P,q) 2q(2p 1)因此B的最佳反應函數為1,當 p 1/2 q 0,1,當 p 1/20,當 p 1/2(2p 1)pa 11/20 1 qP 1 1/2 -* *(P ,q ) (1/2,1/2)納什均衡是:A和B出紅牌還 是出黑牌的概率都是1/2.反應函數法練習1:利用反應函數法找出政府與流浪漢博弈的納什均衡流浪漢找工作 游蕩政府3,2-1 , 3-1 , 10,0救濟 不救濟假設政府救濟的概率為Ui (51);流浪漢

8、找工作的概率為U 1 2 30,當r 1/51,當1/20,1,當 r 1/5 r 0,1,當 1/21,當r 1/50,當1/211/20-1/51 r* *(,r ) (1/2,1/5)納什均衡是:政府以1/2的概 率選擇救助,流浪漢以1/5的 概率選擇找工作。練習2:利用反應函數法找出情侶博弈的所有納什均衡麗娟足球 芭雷大海 WI2,1 I0,。P” 12/3-巴雷0,01 ,2? 一小偷欲偷有守衛看守的倉庫,若小偷去偷 時守衛睡覺(不負責),則小偷偷竊成功(令其價值是V),若守衛沒有睡覺(盡職盡 責),則小偷會被抓住坐牢(設其效用為 - A);再假設守衛睡覺而未被偷的效用為 S, 守衛

9、睡覺而被偷則被解雇,其效用為 -Do寫 出得益矩陣,并分析如果想減少小偷偷東西 的現象發生,如何做效果更好??小偷與守衛博弈小偷 偷pV, -D-A , 00, S0, 0守衛睡q小睡1-q不偷1-p?用支付最大化值 求出:Ui Vpq Ap(1 q) p(Vq A Aq) AU1' Vq A Aq 0 q* V AU2 Dpq S(1 p)q q( pD S Sp)SU2' pD S Sp 0 p* S D?用支付最大化值求出Aq*當加大對小偷的處罰,守衛 偷懶的概率會增加AA qP*當加大對守衛的處罰,小偷偷東西的概率會減小S p*?從道理上講,小偷偷東西是一種犯罪行為,而

10、守恒不負責 僅是失職行為;從性質上講,犯罪的性質比失職的性質嚴 重得多,理所當然應該加重對小偷的處罰,但從上面的分 析可看出,為了減少偷竊的現象,反而是加重對守衛處罰 效果更好.這就是激勵的悖論!?在社會經濟現象中,存在著許多激勵的悖論的現象,如為 了減少考試作弊的現象,應加大對監考人員失職的處罰其 效果更好等等.?激勵的悖論對我們制定政策和規章制度時帶來了有益的 思考.練習:混合策略的納什均衡卜面的博弈是否存在純策略的納什均衡,如果沒有采用混合 策略納什均衡分析。試用支付最大化法和支付等值法兩 種方法算一算混合策略的納什均衡是多少? 通過反應曲 線,求得混合策略的納什均衡.博弈方2博 弈 方

11、12 , 35, 23, 11 , 5CD對于博弈方1采用的混合策略,博弈方2的支付無差異Pa3Pb1 Pa 2 PB 5對于博弈方2采用的混合策略,博弈方1的支付無差異Pc 2 Pd 5 Pc 3 Pd 1解出 PA=0.8,PB=0.2;PC=0.8,PD=0.2策略得益博弈方 1(0.8 , 0,2)2.6博弈方 2(0.8, 0,2)2.6不同均衡概念的關系? A為應納稅款,C為檢查成本,F是偷稅罰款。假定C<A+F。不 存在純戰略納什均衡。請問:如 何才能降低納大逃稅用惠能性稅收機關檢查A-C+F,-A-F不檢查L00A-C, -AA,-A課后作業:以“監督博弈”為關鍵詞在學術

12、期刊網上杳找文 獻:瀏旃至少三篇論文并精誠一篇:寫下筆記。夫妻之爭的混合策略納什均衡看看這個博弈有幾個均衡?時裝足球2, 10 ,00 , 01 ,3足球夫妻之爭存在兩個純策略均衡丈夫時裝足球妻時裝2, 10, 0子足球0, 01 , 3夫妻之爭還存在混合策略納什均時裝C足球F電的略2, 10, 00, 01, 3夫妻之爭Pw(C) 1 Pw(F) 0 Pw(C) 0 Pw(F) 3丈夫的混合策略Ph(C) 2 Ph(F) 0 Ph(C) 0 Ph(F) 1夫妻之爭博弈的混合策略納什均衡博弈方1博弈方2策略得益(0.75 , 0.25 )0.67(1/3 , 2/3 )0.75§多重

13、納什均衡及其甄別?帕累托優勢標準?風險優勢標準?帕累托優勢標準和風險優勢標 準?聚點均衡?相關均衡國家2?看看這個博弈有幾個純策略納什均衡?國戰爭家-5 , -58 , -10-10 , 810 , 10戰爭和平戰爭與和平博弈這個博弈中有兩個純策略 納什均衡,(戰爭,戰爭) 和(和平,和平),顯然 后者帕累托優于前者,所 以,(和平,和平)是本 博弈的一個按帕累托優勢 標準篩選出來的納什均衡。國家2-5, -58, -10-10, 8皿10戰爭和平和平戰爭與和平博弈國戰爭若考慮到或者說是顧忌到其他博弈方可能發生錯誤的原因,帕累托上策均衡并不一定是最優選擇,還需要比較 風險優勢 下面就是兩個例子

14、。博弈萬2博弈 U方1 D9,90,88,0乙7LR風險上策均衡(D, R)從風險優勢標準衡量,帕累托上策均衡(鹿,鹿)并是最優選擇,因為一旦對手方犯了錯誤,暈了頭,選擇了兔的策略 時,你的支付就會由5變成0!你會選擇這么高風險的策略 嗎?而(兔,兔)的策略組合,當對手方犯了錯誤,暈了頭, 選擇了鹿的策略時,你的支付還是 3,并沒有損失!鹿5, 50 , 3兔3, 03, 3獵人2兔鹿獵鹿博弈獵 人1聚點均衡?聚點均衡是利用博弈設定以外的信息和依據選 擇的均衡。文化、習慣、心理或者其他各種特 征都可能是聚點均衡的依據。?城市博弈(城市分組相同)、時間博弈(報出 相同的時間)是聚點均衡的典型例子

15、。城市博弈:聚點均衡的?游戲:請兩個同學上來等四個城市進行分組, 分成兩組,每組兩個城市。如果分組方法相同, 則每人平時分加5分。城市博弈:聚點均衡的?這四個城市是:?上海、長春、哈爾濱、南京博 弈 方15, 10, 04, 41 , 5博弈方2LR相關均衡例子三個納什均衡:無論是純策略的納什均衡(U, L)、 (D, R);混合策略的納什均衡(1/2 , 1/2 ),結果都不理想,不如(U, L)、(D, R)、(D, L)。利 用聚點均衡(天氣,拋硬幣),但仍不理想。相關裝置:1、各 1/3 概率A、B、C2、博弈方1看到是否A ,博弈方2看到是否C3、博弈方1見A采用U,否則D;博弈方2

16、見C采用R,否則L。相關均衡要點:1、構成納什均衡2、有人忽略不會造成問題一、多人博弈中的共謀問題博弈方2博 弈 方10,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方3A博 弈 方 1博弈方2這個博弈純策略的納什均衡是什么?0,0,10-5,-5,0-5,-5,01,1,-5博弈方2LR博弈方3AU-2,-2,0-5,-5,0D-5,-5,0-1,-1,5博 弈 方1博弈方2LR博弈方3B本博弈的純策略納什均衡:(U, L, A)、(D, R, B)前者帕累托優于后者。博弈的結果會是什么呢?(U, L, A)有共謀(Coalition)問題:博弈方1和2同時偏離博弈方2博方1-2,-2,0-5,-5,0-5,-5,0-1,-1,5博弈方2LRUD博弈方3B博

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論