




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、混合策略納什均衡概述2022年9月16日2社會(huì)福利博弈的特征不存在納什均衡類(lèi)似:父母與啃老族回望:另一個(gè)不正常的博弈情侶博弈兩個(gè)納什均衡2022年9月16日3思考如何分析“不存在”納什均衡或存在多個(gè)納什均衡的博弈?2022年9月16日4第三章 混合策略納什均衡第一節(jié) 基本概念:混合策略與期望支付2022年9月16日5第一節(jié) 混合策略與期望支付一、混合策略(一)案例:小偷與守衛(wèi)的貓鼠博弈 守衛(wèi) 睡 不睡 偷 小偷 不偷8,-2-2,00,80,02022年9月16日6小偷與守衛(wèi)博弈無(wú)納什均衡,如何分析?2022年9月16日7第一節(jié) 混合策略與期望支付一、混合策略(二)混合策略1.表述參與人按照一
2、定概率,隨機(jī)從策略組合中選擇一種策略作為實(shí)際行動(dòng)隨機(jī)行動(dòng)的目的:使自己的行為不被對(duì)手預(yù)測(cè)2022年9月16日8混合策略小偷的混合策略以p的概率偷,(p,1-p)守衛(wèi)的混合策略以q的概率睡(q,1-q)2022年9月16日9第一節(jié) 混合策略與期望支付一、混合策略(二)混合策略2.相對(duì)概念:純策略每個(gè)參與人的非隨機(jī)性選擇純粹行動(dòng)計(jì)劃,p=100%,1-p=02022年9月16日10第一節(jié) 混合策略與期望支付一、混合策略(二)混合策略3.數(shù)學(xué)刻畫(huà)給定博弈G=S1,,Sn;u1,un以及參與人i的純策略Si= si1,sik概率分布pi=(pi1,pik)為混合策略其中:0 pik 1, pik=1,
3、 pik=p( sik )混合策略組合p=(p1,pi,pn)2022年9月16日11第一節(jié) 混合策略與期望支付二、期望支付(一)分析1.概率(偷,睡)的概率:pq(偷,不睡)的概率:p(1-q)(不偷,睡)的概率:(1-p)q(不偷,不睡)的概率:(1-p)(1-q)2022年9月16日12第一節(jié) 混合策略與期望支付二、期望支付(一)分析2.期望支付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)= (-2) pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年9月16日13第一節(jié) 混合策略與期望支付二、
4、期望支付(二)數(shù)學(xué)刻畫(huà)2022年9月16日14第一節(jié) 混合策略與期望支付三、混合策略納什均衡給定策略式博弈G=S1,,Sn;u1,un以及混合策略組合p*=(p1*,pi*,pn*)對(duì)于所有i和pii, ii的混合策略空間如果有:i(pi*,p-i*)i(pi,p-i*)則:混合策略組合p*=(p1*,pi*,pn*)為G的混合策略納什均衡2022年9月16日15第二節(jié) 研究方法:反應(yīng)函數(shù)法最佳反應(yīng)函數(shù)曲線交叉法一、案例:麥琪的禮物 Dela 剪發(fā)q 保留(1-q) 賣(mài)表pJim 保留(1-p)-2,-22,22,20,02022年9月16日16二、研究方法:反應(yīng)函數(shù)法二、期望支付1.UJim
5、=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原則:一項(xiàng)含p,一項(xiàng)不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原則:一項(xiàng)含q,一項(xiàng)不含q2022年9月16日17二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)1.Jim:Dela剪發(fā)的概率越小,Jim賣(mài)表越好UJim=2p(1-3q)+2q2022年9月16日18二、研究方法:反應(yīng)函數(shù)法三、反應(yīng)函數(shù)2. Dela : Jim賣(mài)表的概率越小, Dela 剪發(fā)越好UDel=2q(1-3p)+2p2022年9月16日19二、研究方法:反應(yīng)函
6、數(shù)法四、反應(yīng)函數(shù)曲線1.交點(diǎn)(1,0)雙方支付為22.交點(diǎn)(0,1)雙方支付為23.交點(diǎn)(1/3,1/3)雙方支付為2/3qp11/31/31互相為對(duì)方著想,期望支付變小2022年9月16日20作業(yè)利用反應(yīng)函數(shù)法求解“社會(huì)福利博弈”是否需要調(diào)整數(shù)據(jù)?可得出有關(guān)社會(huì)保障體系改革的結(jié)論?2022年9月16日21友軍博弈 英 國(guó) 支持巴頓 支持蒙帥 支持巴頓美國(guó) 支持蒙帥4,32,21,13,42022年9月16日22友軍博弈特征兩個(gè)(多個(gè))納什均衡問(wèn)題:博弈的最終結(jié)果?2022年9月16日23第三章 混合策略納什均衡第三節(jié) 多重納什均衡的選擇標(biāo)準(zhǔn)2022年9月16日24第三節(jié) 多重納什均衡的選擇標(biāo)
7、準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(一)案例:戰(zhàn)爭(zhēng)與和平 C國(guó) 鷹戰(zhàn)略 鴿戰(zhàn)略 鷹戰(zhàn)略 A國(guó) 鴿戰(zhàn)略-5,-58,-10-10,810,102022年9月16日25第三節(jié) 多重納什均衡的選擇標(biāo)準(zhǔn)一、帕累托優(yōu)勢(shì)標(biāo)準(zhǔn):得益更大(二)納什均衡的選擇標(biāo)準(zhǔn)帕累托優(yōu)勢(shì)標(biāo)準(zhǔn)按照支付大小篩選納什均衡-5,-58,-10-10,810,102022年9月16日26第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小?(一)案例:串通作弊博弈 學(xué)生乙 作弊 不作弊 作弊學(xué)生甲 不作弊9,90,88,07,7帕累托優(yōu)勢(shì)?2022年9月16日27第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失
8、比較法1.甲:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=7 9,90,88,07,72022年9月16日28第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法2.乙:?jiǎn)为?dú)偏離均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=7 9,90,88,07,72022年9月16日29第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法3.偏離損失比較方法:偏離“作弊”的損失VS偏離“不作弊”的損失1177 9,90,88,07,72022年9月16日30第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)
9、優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(二)分析:偏離損失比較法4.結(jié)論(1)偏離(不作弊,不作弊)的損失更大:49(2)不偏離(不作弊,不作弊) 9,90,88,07,72022年9月16日31第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)二、風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn):風(fēng)險(xiǎn)更小(三)納什均衡的選擇標(biāo)準(zhǔn):風(fēng)險(xiǎn)優(yōu)勢(shì)標(biāo)準(zhǔn)比較不同納什均衡之間的風(fēng)險(xiǎn)狀況,風(fēng)險(xiǎn)小的納什均衡優(yōu)先 9,90,88,07,72022年9月16日32第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(一)案例:城市分組博弈參與人: 甲 乙策略:把上海、長(zhǎng)春、南京、哈爾濱四個(gè)城市分成兩組,每組2個(gè)城市支付:甲乙分法相同獎(jiǎng)勵(lì)100元;甲乙分法不同獎(jiǎng)勵(lì)0元2022年9月16日33第三節(jié)多重納
10、什均衡的選擇標(biāo)準(zhǔn)三、聚點(diǎn)均衡(二)聚點(diǎn)均衡1.標(biāo)準(zhǔn)使用社會(huì)文化習(xí)慣、博弈歷史等信息達(dá)到均衡1、10、66、8882.實(shí)質(zhì)規(guī)律性2022年9月16日34第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(一)案例:“地域連坐”下的產(chǎn)品質(zhì)量博弈 企業(yè)乙 好產(chǎn)品 差產(chǎn)品 好產(chǎn)品企業(yè)甲 差產(chǎn)品4,4-8,-2-2,-8-2,-22022年9月16日35第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(二)相關(guān)均衡參與人主動(dòng)設(shè)計(jì)某種形式的選擇機(jī)制,形成制度安排,從而確定最終均衡“三鹿”事件出現(xiàn)后,河北省其他食品企業(yè)以后如何做?4,4-8,-2-2,-8-2,-22022年9月16日36第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共
11、謀均衡(一)案例:抽象的選擇 乙 左 右 上甲 下 乙 左 右 上甲 下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B2022年9月16日37第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)1.如果集體偏離(上,左,A)(1)起因:甲、乙集體偏離,選(下,右,A)(2)結(jié)果:甲的支付01,乙的支付01(3)結(jié)論:甲、乙有集體偏離的動(dòng)機(jī), (上,左,A)非抗共謀均衡2022年9月16日38第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵(lì)2.如果集體偏離(下,右,B
12、)(1)若甲、乙集體偏離,選(上,左,B)-1-2, -1-2(2)若甲、丙集體偏離,選(上,右,A)-1-5, 50(3)若乙、丙集體偏離,選(下,左,A)-1-5, 50(4)結(jié)論:缺乏集體偏離的激勵(lì), (下,右,B)為抗共謀均衡2022年9月16日39獵鹿博弈:何為抗共謀均衡? 乙 獵鹿 打兔 獵鹿 甲 打兔10,100,44,04,42022年9月16日40金無(wú)足赤,人無(wú)完人人總是要犯錯(cuò)誤的,所以要對(duì)別人寬容2022年9月16日41經(jīng)得起考驗(yàn)的納什均衡在其他參與人選擇了錯(cuò)誤策略的情況下,某參與人仍能實(shí)現(xiàn)納什均衡他人不犯錯(cuò)誤,你能實(shí)現(xiàn)最優(yōu);他人犯錯(cuò)誤,你仍能實(shí)現(xiàn)最優(yōu)2022年9月16日4
13、2第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡Trembling-hand perfect equilibrium(一)顫抖手某一參與人的非蓄意錯(cuò)誤博弈偏離均衡路徑的原因一個(gè)人用手抓東西時(shí),手一顫抖,就可能抓不住他想抓的東西:非蓄意錯(cuò)誤2022年9月16日43第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡(二)顫抖手均衡1.基本思想給定所有參與人均可能犯錯(cuò)誤的情況下,如果某一策略組合仍是每一個(gè)參與人的最優(yōu)策略組合,則實(shí)現(xiàn)顫抖手均衡如何理解?2022年9月16日44第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)六、顫抖手精煉均衡(二)顫抖手均衡2.定義: mmistaken人博弈中,對(duì)于每一個(gè)博弈方i,存在嚴(yán)格混合策略序列 ,使下列條件得到滿足:(1)盡管每一個(gè)博弈方可能犯錯(cuò)誤,但錯(cuò)誤收斂于零總有一天能成功2022年9月16日45穿針引線功夫不負(fù)有心人將一條線穿入針眼,手在不停顫抖,不大可能一下子
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《高等數(shù)學(xué)》上冊(cè)課件06-05二階常系數(shù)線性齊次微分方程
- 2025年廣告學(xué)基礎(chǔ)知識(shí)能力測(cè)試試卷及答案
- 百貨公司培訓(xùn)
- 直接包裝機(jī)立項(xiàng)投資項(xiàng)目可行性研究報(bào)告
- 《自媒體營(yíng)銷(xiāo)》課件項(xiàng)目一自媒體營(yíng)銷(xiāo)概述
- 多發(fā)肋骨骨折術(shù)后護(hù)理
- 第1章 勾股定理 問(wèn)題解決策略 課件 北師大版數(shù)學(xué)八年級(jí)上冊(cè)
- 內(nèi)科危重患者健康教育
- 4.6.1人體對(duì)外界環(huán)境的感知第2課時(shí) 課件 人教版八年級(jí)生物上冊(cè)
- 營(yíng)養(yǎng)學(xué)電子課件
- 2024年荊州市江北地區(qū)檢察院招聘檢察輔助人員筆試真題
- 2025年高考真題-語(yǔ)文(北京卷) 含答案
- 2025年高考語(yǔ)文全國(guó)一卷試題真題及答案詳解(精校打印)
- 山西焦煤集團(tuán)筆試題
- 星期音樂(lè)會(huì)智慧樹(shù)知到期末考試答案章節(jié)答案2024年同濟(jì)大學(xué)
- 精品灌溉引水工程施工組織設(shè)計(jì)
- 救護(hù)車(chē)注冊(cè)登記審批表
- 口腔頜面部手術(shù)的麻醉PPT學(xué)習(xí)教案
- 平衡與協(xié)調(diào)訓(xùn)練PPT課件
- 年普通高校(中專(zhuān)招生考生體格檢查表
- PEP英語(yǔ)(四下)-Unit-1-My-school--A-let's-learn教學(xué)反思
評(píng)論
0/150
提交評(píng)論