




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第五章第五章 有限理性和進化博弈有限理性和進化博弈 本章介紹有限理性基礎上的進化博弈分析。完全理性在現實中很難滿足,當社會經濟環境和決策問題較復雜時,人們存在很大的理性局限。有限理性對人們的決策、行為選擇方式有很大影響,有限理性基礎上的博弈分析與完全理性博弈分析也有很大區別。進化博弈分析是有限理性博弈分析的基本框架。本章介紹以最優反應動態和復制動態為核心,以進化穩定策略為基本均衡概念的進化博弈分析,包括基本方法、概念和各種經典模型等。5.1 有限理性博弈及其分析框架有限理性博弈及其分析框架 問題的提出:Nash在其博士論文“Non-cooperative games”(1950年)給出Nash
2、均衡的兩種解釋,l一種是完全理性的解釋均衡是通過理性的參與者進行嚴密的邏輯演繹推理得到的,對參與者的理性能力有較高要求。l一種是基于群體行為的解釋當時沒有很好的方法構建數學模型。 傳統博弈中的理性要求傳統博弈中的理性要求1目標理性(主觀理性):參與者追求自身利益的最大化(經濟學理性的內涵);2 具有理性的能力:參與者具有計算推理、預見、記憶、分析判斷的能力(例如:求解動態博弈均衡的遞推歸納法),不會犯錯誤(例如:顫抖手均衡要求犯錯誤時仍具有穩健性);3 認知理性:參與者了解博弈的結構和規則、以及理性的“共同知識”(遞推歸納法的基礎)、作為不完全信息博弈均衡求解基礎的貝葉斯理性(參與者對不確定性
3、事物具有事前概率分布的判斷,在動態過程中進行更新的貝葉斯決策)。傳統博弈的理性假設過于嚴格l有限理性的概念: a Herbet Simon提出有限理性概念,是指:參與者具有目標的理性,但是由于面對復雜的,多元化的,不確定性的社會現實,其認知能力的有限性造成參與者在決策時只能達到滿意解,即缺少理性的能力。b 另一種觀點:有限理性是由于Knight提出的內在的不確定性造成的,即非線性系統固有的不可預知性。有限理性博弈分析的目標有限理性博弈分析的目標 a 放寬參與者嚴格的理性要求,分析有限理性的參與者通過各種學習過程,如何達到穩定的均衡狀態。b 傳統博弈主要解決:Nash均衡的選擇(例如子博弈Nas
4、h均衡)和多重Nash均衡的精練(例如顫抖手均衡)問題。 有限理性博弈分析主要解決:針對不同條件下具體的學習過程(構建的學習模型體現了理性的不同要求)、學習調整過程中均衡的穩定性(運用穩定性理論,分析原Nash均衡是否收斂)。有限理性博弈分析的范圍有限理性博弈分析的范圍a. 個體層次上的有限理性博弈:古諾模型參與者根據對手的上一期行動決定當期策略選擇;虛擬行動參與者對對手行動有一個包括先驗概率在內的概率分布的估計,然后最大化自己的預期收益。b群體層次上的有限理性博弈:演化博弈理論(Maynard Smith and Price與1973年研究生物種群系統的進化現象時提出生物系統的演化博弈基本概
5、念) 。5.1.1 有限理性及其對博弈的影響有限理性及其對博弈的影響l有限理性博弈方:不滿足完全理性假設的博弈方l有限理性意味著一般至少有部分博弈方不會采用完全理性博弈的均衡策略l有限理性意味著均衡是不斷調整和改進而不是一次性選擇的結果,而且即使到達了均衡也可能再次偏離l有限理性博弈方會在博弈過程中學習,博弈通過試錯尋找較好的策略5.1.2 有限理性博弈分析框架有限理性博弈分析框架 有限有限博弈方構成的一定規模的特定群體內成員的某種反復博弈.關鍵是確定博弈方學習和策略調整的模式.l最優反應動態最優反應動態:有快速學習能力的小群體成員的反復博弈及策略調整的動態機制.l復制動態復制動態:學習速度很
6、慢的成員組成的大群體隨機配對的反復博弈及策略調整的動態機制.l進化穩定策略進化穩定策略(ESS)5.2 最優反應動態最優反應動態5.2.1 協調博弈的有限博弈方快速學習模型考慮5個有限博弈方相互博弈的快速學習動態調整模型:50,500,4960,6049,0A博弈方博弈方2BAB博博弈弈方方1協調博弈12345反應、策略調整規則推導反應、策略調整規則推導BtxAtxtxtxBtxtxAiiiiii時,采用;當時,采用當的得益:采用的得益:采用61/22)(61/22)(60)(20)(49)(250)( )iA0,1,2ix tti 假設表示在 時期博弈方 的鄰居中采用 策略鄰居的數量最優反應
7、動態模擬:初次博弈最優反應動態模擬:初次博弈1個個AABABABABBBAAAAABAAAABAABB初次博弈相鄰初次博弈相鄰2個個AAAAAAAABAABBBAA初次博弈相連初次博弈相連3個個ABAABAAAAAAAB所有博弈方都采用 的均衡狀態具有穩健性。而所有博弈方都采用 的均衡狀態不具有穩健性。5.2.2 古諾調整過程古諾調整過程古諾模型反應函數23231221qqqq 1 2 3 4博弈方1 2.5 1.5 2.125 1.875博弈方2 3 1.75 2.25 1.93751|1221dqdrdqdr問題:兩寡頭始終假設對方產量不變最優反應動態模擬收斂條件5.3 復制動態和進化穩復
8、制動態和進化穩: 兩人對稱博弈兩人對稱博弈5.3.1 簽協議博弈的復制動態和進化穩定策略5.3.2一般兩人對稱博弈復制動態和進化穩定策略5.3.3 協調博弈的復制動態和進化穩定博弈5.3.4 鷹鴿博弈的復制動態和進化穩定策略5.3.5 蛙鳴博弈的復制動態和進化穩定策略5.3.1 簽協議博弈的復制動態和進化穩定策略簽協議博弈的復制動態和進化穩定策略經濟活動中的各種合作都可以用簽協議博弈描述。特點理性層次低,大規模群體隨機配對反復博弈。1,10,00,00,0同意博弈方博弈方2不同意同意不同意博博弈弈方方12)1 (00)1 (00)1 (1xuxuxuxxuxxxunyny假設群體中采用“同意”
9、比例x則不同策略期望得益和平均得益為:l博弈方策略類型比例動態變化是有限理性博弈分析的核心,其關鍵是動態變化的速度l以采用“同意”策略類型博弈方的比例為例,其動態變化速度可用下列微分方程反映:3222)1 ()()(xxxxxxxuuxdtdxy動態微分方程的相位圖動態微分方程的相位圖dx/dtx010.5l穩定狀態、不動點:x*=0, x*=1進化穩定策略的檢驗進化穩定策略的檢驗2)1 ()1 (000)1 (101)1 (nynyuuuuu2)1 (000)1 (10)1 (ynnyuuuuu策略選擇了“不同意”意”比例的博弈方偏離“同策略選擇了“同意”同意”比例的博弈方偏離“不ESSxu
10、y是進化穩定策略101不是進化穩定策略00 xuuny5.3.2一般兩人對稱博弈復制動態和進化穩定策略一般兩人對稱博弈復制動態和進化穩定策略一般模型a, ac, bd, db, c策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2X2對稱博弈l進化博弈設定是在一個大群體的成員中進行隨機配對的反復博弈。l基本模型是兩個博弈方之間的對稱博弈。含義是兩個博弈位置是無差異的。l其中abcd可以是任何得益,根據問題設定。5.3.3 演化博弈均衡的一個判斷標準演化博弈均衡的一個判斷標準演化穩演化穩定策略(定策略(Evolutionary Stable Strategy, ESS)l演化穩定策略(E
11、SS)是演化博弈的一個核心概念,其反映了均衡解的穩定性狀態(另一個是模仿者動態,其反映了最常用的一種向均衡穩定狀態的動態收斂過程)。lESS定義:對于非常小的正數定義:對于非常小的正數,所有的,所有的*, 。lESS等價的定義表述:等價的定義表述:條件條件1,對所有的,對所有的* , ,即嚴格,即嚴格Nash均衡;均衡;條件條件2,如果,如果 ,則,則 。)1 ( ,()1 ( ,(uu),(),(uu),(),(uu),(),(uu復制動態分析復制動態分析2121)1()1()1(uxuxudxcxubxaxu)(1 ()()1 ()(1 (dbxcaxxxuuxxdx/dtx1x)1 ()
12、(2111uxxuuxuuxdtdx復制動態的進化規則是生物學中生物特征進化規則設設x為采用策略為采用策略1的的比例比例復制動態相位圖5.3.3 協調博弈的復制動態和進化穩定博弈協調博弈的復制動態和進化穩定博弈50,500,4960,6049,0策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2*2對稱博弈dx/dtx111/16復制動態進化博弈的結果常常取決與帶有很大偶然性的初始狀態。)(1 ()()1 ()(dbxcaxxxxFdtdx)1161)(1 (xxx5.3.4 鷹鴿博弈的復制動態和進化穩定策略鷹鴿博弈的復制動態和進化穩定策略, 0, v, v, 0鷹博弈方博弈方2鴿鷹鴿
13、博博弈弈方方1鷹鴿博弈2cv 2cv 2v2v復制動態方程和相位圖復制動態方程和相位圖2)1 (2)()1 ()(vxcvxxxxFdtdx)61)(1 (xxxdx/dtx11/65.3.5 蛙鳴博弈的復制動態和進化穩定策略蛙鳴博弈的復制動態和進化穩定策略l動物進化競爭是生物多樣性、復雜性的基本機動物進化競爭是生物多樣性、復雜性的基本機制制蛙鳴博弈:P-z, P-z1-m, m-z0, 0m-z, 1-m鳴叫雄蛙雄蛙2不鳴鳴叫不鳴雄雄蛙蛙1蛙鳴博弈不同均衡的條件蛙鳴博弈不同均衡的條件ZM11鳴叫混合策略不鳴叫m=1-P+zm=z蛙鳴博弈復制動態方程和不動點蛙鳴博弈復制動態方程和不動點x鳴叫雄
14、蛙比例)(1 ()1()1 (zmxmzPxxxdtdx可能的不動點: x*=0 x*=1 x*=(m-z)/(1-p)復制動態方程蛙鳴博弈復制動態相位圖蛙鳴博弈復制動態相位圖xdx/dt1(m-z)/(1-P)0dx/dtx1(m-z)/(1-P)0(m-z)/(1-P)15.4 復制動態和進化穩定性:兩人非對稱博復制動態和進化穩定性:兩人非對稱博弈弈5.4.1 市場阻入博弈的復制動態 和進化穩定策略5.4.2 非對稱鷹鴿博弈的進化分析5.4.1 市場阻入博弈的復制動態和進化穩定市場阻入博弈的復制動態和進化穩定策略策略)1 ()1 (2)1 (11)1 (1)1 ( 22)1 (011111
15、xyxuxuxuyyuyyyunene12進入不進打擊不打(0,0)(2,2)(1,5)xxyuyuyuxxxuxxxunsns325)1 (355)1 (2555)1 (022222博弈方博弈方1 1位置位置博弈群體復制動態相位圖博弈群體復制動態相位圖xdx/dt1y1/2xdx/dt1y5/6xdx/dt1y1/6ydy/dt1x1/6ydy/dt1x=1/6)61)(1 (22xyyuuydtdye兩群體復制動態關系和穩定性兩群體復制動態關系和穩定性xY111/65/6BDCA 總結和前沿研究的管窺總結和前沿研究的管窺l傳統博弈和演化博弈的各自適用范圍: 傳統(古典)博弈 a 基本特點:假定參與者在信息收集、預期形成、后果推斷和決策上是超理性的,但是這種共同預期是如何形成的未加說明。 b 適用范圍:側重于人類的演繹推理能力,可分析規則的人為設計(如委托代理關系中機制設計)。 演化博弈 a 基本特點:假定參與者理性是非常有限的,在行動上被慣例的惰性和簡單模仿所驅使,但是無法保證均衡結果的收斂。 b 適用范圍:側重于人類以觀察為基礎的歸納能力,可以分析以慣例、習俗體現的規則的自發演化。l演化博弈的研究現狀a國外理論研究中著重于不同的具體學習過程構建模型,一般化模型、基于案例分析的模型等;b另一個方向是解決多變的演化環境下,博弈中創新行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家禽孵化廠管理制度
- 弱電井施工管理制度
- 律師所案件管理制度
- 德克士庫存管理制度
- 快遞pda管理制度
- 快餐分餐間管理制度
- 總決算編制管理制度
- 總經辦規章管理制度
- 慈善會印章管理制度
- 成品庫盤點管理制度
- 國家開放大學《傳感器與測試技術》實驗參考答案
- 【廣東】高層檔案館建筑方案文本2020
- 流行病學傳染病流行病學幻燈片
- 藥物配伍禁忌查詢表
- 參加培訓人員匯總表
- 0720小罐茶品牌介紹
- 常州市機械行業安管考試題庫
- 手術記錄-頸胸椎前后路脫位c7t
- PPT模板:小學生防溺水安全教育主題班會08課件(45頁PPT)
- 如何當好副職
- GB∕T 10544-2022 橡膠軟管及軟管組合件 油基或水基流體適用的鋼絲纏繞增強外覆橡膠液壓型 規范
評論
0/150
提交評論