




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第10講:有限理性博弈(I):
具有快速學習能力的小群體成員的反復博弈1outline1、完全理性&有限理性2、具有快速學習能力的小群體成員的反復博弈:一般分析思路3、協調博弈的有限理性博弈方快速學習模型4、進化穩定策略(EvolutionaryStableStrategy:ESS)21、完全理性&有限理性3完全理性經濟學通常假設人們有完全理性有始終追求最大利益的完美意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力。4完全理性&有限理性經濟學通常假設人們有完全理性,但這種假設的現實性是有問題的。事實上,人們只是在分析處理比較簡單問題時接近完全理性要求,但在分析復雜問題時理性的局限性很明顯。5完全理性&有限理性基于博弈方具有完全理性的假設,我們已經分析了:完全信息靜態博弈完全且完美信息動態博弈重復博弈6完全理性&有限理性博弈問題通常包含復雜的相互依存關系,博弈分析往往是很復雜的,因此指望現實的博弈方都能通過博弈分析找到最優策略,而且不會因為遺忘、失誤、任性等原因偏離最佳選擇,常常是不切實際的。7完全理性&有限理性如果我們只是在完全理性假設下進行博弈分析,顯然是不夠的,會影響博弈論的適用范圍和價值。8完全理性&有限理性理性完全理性有完美的分析判斷能力和不會犯選擇行為的錯誤。有限理性(BoundedlyRational)不滿足完全理性假設,即博弈方的判斷選擇能力有缺陷。9完全理性&有限理性博弈問題“完全理性博弈”所有博弈方均符合完全理性假設下的博弈問題。“有限理性博弈”博弈方的判斷選擇能力有缺陷情況下的博弈問題。10完全理性&有限理性有限理性博弈11完全理性&有限理性有限理性意味著博弈方往往不會一開始就找到最優策略,會在博弈過程中學習博弈,必須通過試錯尋找較好的策略;有限理性也意味著一般至少存在部分博弈方不會采用完全理性博弈的均衡策略;有限理性還意味著均衡是不斷調整和改進而不是一次性選擇的結果,而且即使達到了均衡也可能再次偏離。12完全理性&有限理性需要引入新的分析方法13有限理性博弈典型的有限理性博弈(1)具有快速學習能力的小群體成員的反復博弈(2)學習速度較慢的成員組成的大群體隨機配對的反復博弈142、具有快速學習能力的小群體成員的反復博弈:一般分析思路15具有快速學習能力的小群體成員的反復博弈具有快速學習能力的小群體成員的反復博弈博弈方的理性層次較高、學習速度較快,能迅速調整策略。16具有快速學習能力的小群體成員的反復博弈(續)一般分析思路:(1)(初始條件)初次進行博弈時,各別博弈方的策略選擇;(2)博弈方相互博弈、學習和模仿的環境條件;(3)博弈方的理性層次決定的學習和策略調整的方式、特征。17博弈方的理性層次決定的學習和策略調整的方式、特征。策略調整機制:最優反應動態(Best-ResponseDynamics)給定前期的經驗(即博弈結果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應策略。183、協調博弈的有限理性博弈方快速學習模型19具有快速學習能力的小群體成員的反復博弈(續)例:協調博弈的有限理性博弈方快速學習模型20協調博弈的有限理性博弈方快速學習模型協調博弈的有限理性博弈方快速學習模型2112345有5個有限理性博弈方,分別位于圖示圓周的5個位置上;每個博弈方都與各自的左右鄰居反復博弈。博弈方的博弈內容是“協調博弈”(CoordinationGame)。
博弈方相互博弈、學習和模仿的環境條件協調博弈的有限理性博弈方快速學習模型(續)22博弈方2AB博弈方1A50,5049,0B0,4960,60協調博弈具有兩個純策略納什均衡(A,A)和(B,B)協調博弈的有限理性博弈方快速學習模型(續)假設博弈方雖然缺乏分析交互動態關系和預見能力,但是能夠馬上對上一階段的博弈結果進行總結,并立即做出相應的策略調整。(最優反應動態:給定前期的經驗(即博弈結果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應策略。
)23博弈方的理性層次決定的學習和策略調整的方式、特征
協調博弈的有限理性博弈方快速學習模型(續)博弈方的理性層次決定的學習和策略調整的方式、特征24假設xi(t)為在t時期博弈方i的鄰居中采用A策略的數量,該數量有0、1、2三個可能值。采用B策略的鄰居的數量相應為2-xi(t),也有0、1、2三個可能值。12345協調博弈的有限理性博弈方快速學習模型(續)針對第t
期的相關情況xi(t),博弈方
i
采用策略A的得益為xi(t)·50+[2-xi(t)]·49,博弈方
i采用策略B則得益為xi(t)·0+[2-xi(t)]·60。25博弈方2AB博弈方1A50,5049,0B0,4960,60xi(t):在t時期博弈方i的鄰居中采用A策略的數量;2-xi(t)
:在t時期博弈方i的鄰居中采用B策略的數量。協調博弈的有限理性博弈方快速學習模型(續)根據最優反應動態機制,當xi(t)·50+[2-xi(t)]49>xi(t)·0+[2-xi(t)]60即xi(t)>22/61時,博弈方i在t+1時期會采用A,而當xi(t)·50+[2-xi(t)]49<xi(t)·0+[2-xi(t)]60即xi(t)<22/61時,博弈方i在t+1時期會采用B。26博弈方2AB博弈方1A50,5049,0B0,4960,60最優反應動態:給定前期的經驗(即博弈結果),各個博弈方本期都能找到和采用針對前期其他博弈方策略的最佳反應策略。協調博弈的有限理性博弈方快速學習模型(續)由于xi(t)只能取0、1、2這三個整數,因此上述反應機制實際上就是:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A;如果在t時期博弈方i的兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。27當xi(t)>22/61時,博弈方i在t+1時期會采用A;當xi(t)<22/61時,博弈方i在t+1時期會采用B。協調博弈的有限理性博弈方快速學習模型(續)初次進行博弈時,各別博弈方的策略選擇(博弈方都是有限理性的)初次博弈總共有25=32種可能的情況。2812345博弈方2AB博弈方1A50,5049,0B0,4960,60協調博弈的有限理性博弈方快速學習模型(續)但是,這32種情況中不少實質上是相同的,只是哪個博弈方采用A或B有所不同,把圓周作一定的旋轉就能完全重合。29BABBAABABB協調博弈的有限理性博弈方快速學習模型(續)根據采用A策略博弈方的數量和分布,總共有8種無實質差異,無法通過圓周旋轉而重合的情況:(1)0A;(2)1A;(3)相鄰2A;(4)不相鄰2A;(5)3連A;(6)非3連A;(7)4A;(8)5A。3012345協調博弈的有限理性博弈方快速學習模型(續)31最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BBBBBBBBBB情形1:初次博弈有0個A協調博弈的有限理性博弈方快速學習模型(續)情形2:初次博弈有1個A32最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。ABBBBBABBAABAABAAAAABAAAA協調博弈的有限理性博弈方快速學習模型(續)情形3:初次博弈有相鄰2A33最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BAABBAAAABAAAAA協調博弈的有限理性博弈方快速學習模型(續)情形4:初次博弈有不相鄰2A34最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。BABBAABAABAAAAABAAAA協調博弈的有限理性博弈方快速學習模型(續)情形5:初次博弈有3連A35最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAABBAAAAA協調博弈的有限理性博弈方快速學習模型(續)情形6:初次博弈有非3連A36最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。ABAABAAAAABAAAA協調博弈的有限理性博弈方快速學習模型(續)情形7:初次博弈有4A37最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAAAABAAAA協調博弈的有限理性博弈方快速學習模型(續)情形8:初次博弈有5A38最優反應動態機制:如果在t時期博弈方i的兩個鄰居中只要有1個采用A,那么博弈方i在第t+1時期采用A,如果兩個鄰居都沒有采用A,那么博弈方i在t+1時期采用B。AAAAAAAAAA協調博弈的有限理性博弈方快速學習模型(續)總結:除了初次博弈時所有博弈方都采用B的一種情況以外,從其余所有的情況出發,經過或多或少時期的最優反應動態法則的調整,最終都會收斂到所有博弈方都采用A的穩定狀態。39協調博弈的有限理性博弈方快速學習模型(續)“所有博弈方都采用A策略”和“所有博弈方都采用B策略”都是有限理性博弈方進行上述協調博弈的穩定狀態,但前一種穩定狀態顯然要更重要一些。在上述設定下,總共32種可能的初次博弈情況中只有一種是穩定于所有博弈方采用B的狀態,其余31種都會收斂到采用A的狀態。40協調博弈的有限理性博弈方快速學習模型(續)“所有博弈方都采用A”的穩定狀態是具有“穩健性”的在達到所有博弈方都采用A的穩定狀態后,如果出現少數博弈方偏離A的情況,那么最優反應動態會使博弈方的策略很快回到都采用A的狀態。41協調博弈的有限理性博弈方快速學習模型(續)“所有博弈方都采用B”的穩定狀態不具有穩健性一旦某個博弈方偏離B,那么最優反應動態會使博弈方的策略離該穩定狀態越來越遠。42差之毫厘,謬以千里434、進化穩定策略(EvolutionaryStableStrategy:ESS)44協調博弈的有限理性博弈方快速學習模型(續)進化穩定策略(EvolutionaryStableStrategy:ESS)同時具有(1)在博弈方的動態策略調整中會達到,又(2)對少量偏離的擾動有穩健性這兩個性質的穩定狀態,在進化博弈中被稱為“進化穩定策略”。在上述協調博弈中,所有博弈方都采用A就是一個進化穩定策略,而所有博弈方都采用B則不是進化穩定策略。45有限理性博弈的一般分析思
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電力設備采購合同終止及電力系統穩定性保障函
- 能源科技人才代理招聘與節能減排合同
- 城市廣場場地租賃安全管理合同
- 茶藝文化交流與合作發展協議
- 餐飲店員工勞動合同及職業健康管理協議
- 定制絲綢制品的個性化設計在時尚產業中的應用前景分析考核試卷
- 培訓效果與組織績效的關聯研究考核試卷
- 智能制造與供應鏈數字化標準化研究考核試卷
- 企業并購與整合策略考核試卷
- 心理輔導在初等教育課堂管理中的應用考核試卷
- 22G101三維彩色立體圖集
- 廣東省韶關市樂昌市2023-2024學年八年級下學期期末數學試卷
- 建筑施工安全生產治本攻堅三年行動方案(2024-2026年)
- 共享工作室租賃合同
- 新部編版語文1-6年級2460個生字表(帶拼音)
- 中國成人ICU鎮痛和鎮靜治療指南
- 中華民族共同體概論課件專家版3第三講 文明初現與中華民族起源(史前時期)
- 2023年湖北省普通高中學業水平合格性考試地理試題(原卷版)
- 培訓采耳師課件
- 建筑項目的合規與法律要求
- 玻璃粉生產工藝
評論
0/150
提交評論