




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第二講(1)完全信息靜態(tài)博弈
所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題納什均衡無限策略博弈的解和反應函數(shù)混合策略納什均衡的存在性2.1納什均衡博弈的解和納什均衡嚴格下策反復消去法與納什均衡2.1.1博弈的解和納什均衡定義在博弈中,如果策略組合中任一博弈方i的策略都是對其余博弈方的策略組合的最佳對策,也即對任意都成立,則稱為G的一個納什均衡。2.1.1博弈的解和納什均衡劃線法
囚徒2
不坦白坦白囚不坦白徒
1坦白箭頭法囚徒2
不坦白坦白囚不坦白徒
1坦白
-1,-1
-8,0
0,-8
-5,-5-1,-1
-8,00,-8
-5,-52.1.2嚴格下策反復消去法與納什均衡嚴格下策:對于某一策略,若則稱為的嚴格下策。命題2.1在n個博弈方的博弈中,如果嚴格下策反復消去法排除了以外的所有策略組合,則一定是G的唯一的納什均衡。命題2.2在n個博弈方的博弈中,如果是G的一個納什均衡,則嚴格下策反復消去法一定不會將它消去。2.1納什均衡納什均衡點是一種局部均衡點,可以有很多個,也可以不存在。來源于策略組合的策略可能有n!個(離散),也可能無窮多個(連續(xù)),那么求解將會十分煩瑣。得益對于任一策略(s1,…,sn),其總得益為各博弈方得益之和那么對于具有多個納什均衡點的博弈,則對應的應有最優(yōu)納什均衡的概念,而對應于最優(yōu)納什均衡的點為全局最優(yōu)點。此處最優(yōu)的含義為穩(wěn)定性而不是得益之和最大。如何均衡穩(wěn)定與收益?2.2無限策略的解和反應函數(shù)古諾的寡頭模型反應函數(shù)伯特蘭德的寡頭模型公共資源問題2.2.1古諾的寡頭模型
博弈方1利潤:博弈方2利潤:在本博弈中,的納什均衡的充分必要條件是和的最大值問題:社會收益最大化:假設總產(chǎn)量為Q,總收益為U=QP(Q)-CQ
=Q(8-Q)-2Q=6Q-Q2
其最大值為Q*=3,U=9
該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。2023/2/594.5,4.55,3.753.75,54,4不突破突破廠商2不突破突破廠商1以自身最大利益為目標:各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈2.2.2反應函數(shù)
反應函數(shù)-每個博弈方針對其他博弈方所有策略的最佳反應構(gòu)成的函數(shù)。而各個博弈方反應函數(shù)的交點(如果有的話)就是納什均衡。2.2.2反應函數(shù)-古諾模型在古諾模型中廠商1和廠商2的反應函數(shù)分別為q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)
從左圖可以看出,當一方的選擇為0時,另一方的最佳反應為3,這正是我們前面所說過的實現(xiàn)總體最大利益的產(chǎn)量,因為一家產(chǎn)量為零,意味著另一家壟斷市場。當一方的產(chǎn)量達到6時,另一方則被迫選擇0,因為實際上堅持生產(chǎn)已無利可圖。2.2.3伯特蘭德的寡頭模型在該模型中廠商選擇價格而不是產(chǎn)量廠商1的價格與需求函數(shù):P1,廠商2的價格與需求函數(shù):
P2,其中,d1,d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設兩廠商無固定成本,邊際成本分別為c1和c2。收益:納什均衡:2023/2/513公共地悲劇英國人哈定:十八世紀以前,蘇格蘭地區(qū)大量草地,由于屬公共資源導致過度放牧,致使草地消失,生態(tài)破壞2.2.4公共資源問題2023/2/514公共產(chǎn)品的供給
如果大家都出錢興辦公用事業(yè),所有人的福利都會增加。問題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以每個人的最優(yōu)選擇都是“不出錢”,結(jié)果使所有人的福利都得不到提高。軍備競賽
兩國都不搞軍備競賽,都把資源用于民用,兩國福利都變好。但由于都怕受威脅而大搞軍備競賽,結(jié)果兩國福利都變得更糟。經(jīng)濟改革經(jīng)濟改革要付出成本(包括風險),而改革的成果大家享受,結(jié)果是,盡管人人都認為改革好,卻很難有人真正去改革,大家只好在都不滿意的體制下繼續(xù)生活下去。2.2.4公共資源問題2.2.4公共資源問題公共資源(1)沒有哪個個人、企業(yè)或其他經(jīng)濟組織擁有;(2)大家都可以自由利用這兩個特征的自然資源或人類生產(chǎn)的供大眾免費使用的設施或財貨。例設某村莊有n個農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個農(nóng)戶各自的策略空間,當各戶養(yǎng)羊數(shù)為q1,…,qn時,總數(shù)為Q=q1+…+qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V=V(Q)=V(q1+…+qn),假設每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui=qiV(Q)-qic2.2.4公共資源問題-實例
設n=3,V=100-Q=100-(q1+q2+q3),c=4
三農(nóng)戶的得益函數(shù)和反應函數(shù):
u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3
u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3
u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2
納什均衡:q1*=q2*=q3*=24,
u1*=u2*=u3*=576
最大總體收益:u*=2304Q*=48
由此說明,納什均衡的解常常是低效率的,而在現(xiàn)實生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個體的貪婪性將會來破壞這一平衡。2.3混合策略概念應用2.3.1概念的提出在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭等博弈問題不存在納什均衡策略組合,然而這類問題十分常見。例1小偷與守衛(wèi)的博弈守衛(wèi)睡不睡小偷偷不偷V,-D-P,00,S0,02023/2/519小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對首位的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概略0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率12.3.1概念的提出2023/2/520V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概略1小偷和守衛(wèi)的博弈猜硬幣博弈
猜硬幣方正面反面蓋硬正面幣方反面該博弈與上一個例子相似,即取勝的關(guān)鍵都是不能讓另一方猜到自己的策略而同時自己又要盡可能猜出對方的策略。若p>1/2,則猜硬幣方全猜正面,他的期望得益為p×1+(1-p)×(-1)=2p-1>0,即平均來說,猜硬幣方贏多輸少。
-1,11,-11,-1-1,1例2猜硬幣
1.若被對手事先知道出現(xiàn)哪一面,肯定輸
2.若正面出現(xiàn)的概率為p,負面為1-p,且p>0.5,則猜正面的話贏的幾率就比較大。2.3.1概念的提出2023/2/522
混合策略反應函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布2023/2/523
混合策略反應函數(shù)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布2.3.1概念的提出特點:1.自己的選擇不能讓對手預先知道2.若重復多次,則不讓對手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個手段,有意無意間讓對手了解自己的策略或規(guī)律。2.3.1概念的提出定義:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空間為Si={si1,…,sik},則博弈方i以概率分布pi=(pi1,…,pik)隨機選擇其k個可選策略稱為一個“混合策略”,其中0≤pik≤1對k=1,…,k都成立且pi1+…+pik=1。相對于這種以一定概率分布在一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”混合策略的原則:自己的策略選擇不能被另一方預知或猜到。即在決策時利用隨機性。選擇每種策略的概率一定要恰好使對方無機可乘,即讓對方無法通過有針對性的傾向某一策略而占上風。2.3.2應用博弈方1選A、B的概率:pA,pB;博弈方2選C、D的概率:pC,pD。原則應用:博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×
3
+pB×1=pA×
2
+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1應選的混合策略。同理可得博弈方2的混合策略為pC=0.8,pD=0.2。納什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6
單獨一次博弈的結(jié)果可能是四種狀態(tài)的任何一種,然而多次獨立重復博弈得到如上的結(jié)果是可能的。
2,35,23,11,5
2CDA1B2.3.2應用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應用于存在多個純策略納什均衡的博弈問題。例夫妻之爭該博弈與上一個博弈的不同之處在于每一方所希望對方知道自己的策略選擇以達到有利于自己的結(jié)果。現(xiàn)實中,這類問題多通過協(xié)商解決以免兩敗俱傷。在此我們假設夫妻雙方不可協(xié)商,互不通消息。令pw(時),pw(足)分別表示妻子選擇時裝表演和足球的概率;
ph(時),
ph(足)為丈夫選擇時裝表演和足球的概率。同樣的分析方法可得pw(時)=0.75,pw(足)=0.25;ph(時)=1/3,ph(足)=2/3.雙方的期望得益分別為uwe=0.67,uhe=0.75。
丈夫時裝足球妻時裝子足球2,10,00,01,32023/2/5282.3.2應用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應用于存在多個純策略納什均衡的博弈問題。例夫妻之爭該博弈與上一個博弈的不同之處在于每一方所希望對方知道自己的策略選擇以達到有利于自己的結(jié)果。現(xiàn)實中,這類問題多通過協(xié)商解決以免兩敗俱傷。在此我們假設夫妻雙方不可協(xié)商,互不通消息。令pw(時),pw(足)分別表示妻子選擇時裝表演和足球的概率;
ph(時),
ph(足)為丈夫選擇時裝表演和足球的概率。同樣的分析方法可得pw(時)=0.75,pw(足)=0.25;ph(時)=1/3,ph(足)=2/3.雙方的期望得益分別為uwe=0.67,uhe=0.75。
丈夫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CECS 10179-2022建筑金屬結(jié)構(gòu)及圍護系統(tǒng)認證通用技術(shù)要求
- T/CECS 10079-2019鋼鐵冶煉塵泥制鐵質(zhì)校正料
- T/CCPITCSC 108-2022在線商事調(diào)解服務規(guī)范
- T/CCMA 0177-2023工程機械數(shù)字化水平評估規(guī)范
- T/CCIAS 018-2023壽喜鍋調(diào)味汁
- T/CAQP 001-2017汽車零部件質(zhì)量追溯體系規(guī)范
- T/CAQI 224-2021城鎮(zhèn)污水深度處理技術(shù)規(guī)范
- T/CAQI 122-2020家用和類似用途飲用水處理裝置用納濾膜組件安全使用壽命評價規(guī)范
- 海員業(yè)務考試題及答案
- 醫(yī)藥代表面試題及答案
- 四六級英語寫作考試輔導資料課件
- 交流電機理論分析
- 真石漆飾面工程檢驗批質(zhì)量驗收記錄
- 婦產(chǎn)科手術(shù)配合課件
- 地基強夯工程專項施工方案專家論證版
- (中職)中國稅收:稅費計算與申報項目十四 企業(yè)所得稅計算與申報課件
- 心理照護教材課件匯總完整版ppt全套課件最全教學教程整本書電子教案全書教案課件合集
- 男朋友申請表
- 高中心理健康:我心換你心——心理主題:人際交往 課件(22張PPT)
- 高清元素周期表(專業(yè)版)
- 北京中考英語作文模板
評論
0/150
提交評論