第七章-不完全信息動態博弈課件_第1頁
第七章-不完全信息動態博弈課件_第2頁
第七章-不完全信息動態博弈課件_第3頁
第七章-不完全信息動態博弈課件_第4頁
第七章-不完全信息動態博弈課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章不完全信息動態博弈

主要討論貝葉斯博弈中的動態部分,即動態貝葉斯博弈,或稱不完全信息動態博弈。動態和非動態的主要區別在于動作的是否同時發生,是否有先后次序。2023/7/2017.1不完全信息動態博弈及其轉換不完全信息動態博弈在博弈中至少有部分博弈方對其他某些博弈方的得益不是非常清楚,且具有這樣特征的不僅僅是靜態博弈問題,許多動態博弈問題也同樣具有這樣的特征。2023/7/2027.1不完全信息動態博弈及其轉換舉例:古玩市場,是一種不完全信息的動態博弈,也即動態貝葉斯博弈。實際上不是只有古玩交易是不完全信息動態博弈,任何交易在一定程度上都可以說是不完全信息的動態博弈,因為多數情況下交易一方對另一方究竟有多想做成這筆買賣是無法完全清楚地。小伙子向姑娘求婚,姑娘的父母既不想嚇走小伙,又想多要彩禮。2023/7/2037.1.2類型和海薩尼轉換在靜態貝葉斯博弈中,解決不完全信息的辦法是將對得益的不了解轉換為對類型的不了解,這樣就把不完全信息的博弈轉化成了完全但不完美的動態博弈,并且稱這樣的轉化為海薩尼轉換。2023/7/204

7.1.2類型和海薩尼轉換海薩尼轉換同樣適合于動態貝葉斯博弈,因為動態貝葉斯博弈本身就是動態博弈,轉換成的完全但不完美信息動態博弈與一般的完全但不完美信息動態博弈幾乎沒有差別,從而對動態貝葉斯博弈的分析討論完全可以借用海薩尼轉換的思路和方法解決。(二手車市場交易博弈就可以理解成一個不完全信息動態博弈。)2023/7/2057.2.1信號博弈模型信號博弈:是一類在兩個博弈方之間的不完全信息動態博弈總稱。這種博弈中的兩個博弈方各自都只有一次行為,后行為的一方具有不完全信息,但是他可以從先行為一方的行動中獲得部分信息,因此先行為一方的行為對后行為的一方來講就好像是一種反映其得益函數的信號,因此這種博弈被稱之為“信號博弈”。信號發出方/信號接收方2023/7/2067.2.1信號博弈模型S:信號發出方;R:表示信號接收方US、UK分別表示S和R的得益S的類型空間:S的行為空間:R的行為空間:博弈方O為S選擇類型的概率分布:2023/7/2077.2.1信號博弈模型一個信號博弈可以表示為:博弈方O以概率選擇類型ti

,并讓S知道;S選擇行為mj

;R看到mj后選擇行為ak;S和R的得益us和uk都取決于ti,mj和ak。2023/7/2087.2.2信號博弈完美貝葉斯均衡完美貝葉斯均衡需要滿足的幾個條件:信號接收方R在觀察到信號發出方S的信號mj之后,必須有關于S的類型的判斷,即S選擇mj時,S是每種類ti的概率分布給定R的判斷

和S的信號mj,R的行為a*(mj)必須使R的期望得益最大,即a*(mj)能實現:2023/7/2097.2.2信號博弈完美貝葉斯均衡給定R的策略a*(mj)時,S的選擇m*(ti)必須使得S的得益最大,即m*(ti)必須滿足:對每個,如果存在,使得則R在對應于mj的信息集處的判斷必須符合S的策略和貝葉斯法則。即使不存在使得,R在mj對應的信息等處的判斷仍要符合S的均衡策略和貝葉斯法則。2023/7/20107.2.3股權換債權背景:企業上新項目,需要一筆外部投資,現在企業無法估計自身上了新項目以后的盈利能力,而潛在的投資者也不能看到該企業的真是的盈利能力。

假設該企業向潛在的投資者給予一定的股份換取投資,那么,在什么樣的情況下提議會被接受,同時,企業給多少股份比較合適?我們需要將此問題轉化為一個簡單的信號博弈問題。

2023/7/20117.2.3股權換債權

設現有企業的利潤有高低兩種可能,

設新項目所需投資為I,而他的收益為R,那么這個項目要有吸引力,它的收益必須大于將

I投資到他處的利益,設他處的利益率為r,則是基本的前提條件,將該博弈改寫成如下信號博弈模型:

2023/7/20127.2.3股權換債權自然隨機決定該企業的原有利潤π是高還是低,已知。企業自己了解π,愿出S比例股權換回投資

I。

投資人看到S,但看不到π,只知道π是高或低的概率,然后選擇接受企業提議還是拒絕。如投資人拒絕,則投資人得益為,企業得益為π;投資人接受,則其得益,企業得益。2023/7/20137.2.4勞動市場信號博弈1.自然隨機決定一個工人的生產能力η,η有高低兩種可能,分別記為H和L.并且自然選擇能力高低的概率p(η=H)和p(η=L)是公共的知識2.工人清楚自己的生產能力屬于高還是低,然后他為自己選擇一個受教育的水平e≥03.兩廠商都觀察到工人的受教育水平(注意不是他的能力),然后同時提出愿支付給工人的工資率4.工人接受工資率較高的一份工作,如兩廠商所出工資率相同,則隨機決定為誰工作。用W記工人接受工作時的工資率。2023/7/20147.2.4勞動市場信號博弈在的上面博弈中,工人的得益為W-C(η,e),其中C(η,e)是該能力η,受教育程度為e的工人勞動的成本;雇到該工人的廠商的得益為y(η,e)-W,其中y(η,e)是該工人的生產率,設雇到該工人的廠商的得益為0。因為該博弈中工人選擇受多少教育對廠商來講是一個工人生產能力高低的信號,因此這是一個信號博弈問題。但是與前面的有差異,本博弈中的信號接受方是兩個而不是一個,嚴格這是一個三個博弈方之間有同時選擇的兩個階段不完全信息信號博弈。2023/7/20157.2.4勞動市場信號博弈存在兩個廠商相互競爭的雇主的特征體現在廠商均衡策略的決定方式上,由于本模型中存在兩個廠商,雇不到工人的廠商的得益(即利潤)為0,因此兩廠商之間的競爭必然會使廠商的期望得益趨向于0,即對廠商來說,其最佳策略是讓工資接近其生產率。2023/7/20167.2.4勞動市場信號博弈對受教育程度e的具體含義的理解E是由上學的年限、受教育的多少還是由員工天生的能力來確定,這個并不十分清楚。在這里我們可以將e理解為修讀課程的數量和成績,甚至理解為所讀學校質量的優劣。我們可以將受教育程度分為小學、中學、大學……等幾個檔次,也是一種可行的方法。2023/7/20177.2.4勞動市場信號博弈前面的假設:兩個廠商同時作為信號接收方,并且他們之間的競爭會使他們所做出的工資率相當于工人的勞動生產率。為了保證上述假設的成立,必須再假設兩廠商在觀察到工人的受教育程度e以后,對工人的能力有相同的判斷這樣兩廠商愿意出的工資率為:2023/7/20187.2.4勞動市場信號博弈完全信息的相似博弈:工人的真正能力非但他自己知道,而且兩個廠商也很清楚。設這個工人的能力為η,受教育程度為e,則能掙工資W(e)=y(η,e),工人選擇受多少教育e的決策是要使e滿足:

設其解為e*(η),則工資和受教育水平之間的均衡如下圖,其中η0η1η2是能力無差異曲線,對應于工人的不同能力。2023/7/20197.2.4勞動市場信號博弈完全信息勞動力市場均衡WeW*(η)e*(η)η1η0y(η,e)2023/7/20207.2.4勞動市場信號博弈不完全信息:給低能力的工人提供了偽裝成高能力工人的可能性,但是低能力的人偽裝成高能力具有較多的教育的同時,要看他獲得的和付出的代價是否相比合算,當滿足下列條件時:

低能力工人有利可圖,如果不能滿足,最好還是不要弄虛作假。在上述的不完全信息的博弈中,同樣存在合并均衡、分開均衡、以及混合均衡,在此不作討論。2023/7/20217.3重復信號在經濟活動和其他各種活動中,長期合作是非常重要的一個方面。但是在長期合作中還有不同的情況,有一些長期關系是一次次相對獨立的交易反復進行這樣的形式維系的,在這種長期合作中,一般雙方是否守信譽、講質量比較容易看清,但還有一類是合作雙方簽有長期合約、比較緊密的合作關系。因此確立合作關系前對合作對象的判斷是非常重要的。2023/7/20227.3重復信號乒乓球俱樂部需要增加一名新選手,根據經驗,應試的選手中有尖子選手(平均勝率90%),也有一般選手(平均勝率50%),初選出的選手中含有50%的尖子選手,而挑選人想要尖子選手。由于信息不完全,一般通過試用期來判斷選手是否為尖子選手。設選手沒有選擇余地,一旦簽約選手必須為俱樂部永遠比賽;設后一次比賽成績折算成前一次比賽的貼現數為0.95,每贏一次得益為1,輸一次得益為0。2023/7/20237.3重復信號簽約一尖子選手長期期望得益的現值是:簽約一個一般選手的長期期望得益的現值是:

可以立即通過初試選手,這時的期望得益為:一般精明的管理者的做法是讓初試選手通過一個試用期,然后再作決定。這就涉及到試用期的長短,以及比賽次數的設計問題。2023/7/20247.3重復信號0001(18)(14)(10)(14)(18)(14)(10)(14)勝(0,9)不簽1簽簽不簽不簽不簽簽簽負(0,1)勝(0,5)負(0,5)一般(0,5)尖子(0,5)圖7.2一次比賽試用期2023/7/20257.3重復信號在試用期結束后,由四種方式決定:1.不管誰輸誰贏都簽約:得益為142.贏就簽約,輸就不簽約:期望得益為14.83.贏不簽約,輸簽約:期望得益為13.24.輸贏都不簽約,此時的期望得益還是14

2023/7/20267.3重復信號從上面的討論看出,只有第二種策略才是合理性的,選擇此策略,加上前面的幾個條件概率構成的判斷,就是本博弈的一個完美貝葉斯均衡。但是犯錯的幾率仍然很大,避免或者減少的方法就是利用較長的試用期的“重復信號”。

2023/7/20277.3重復信號到目前為止,我們還沒有解決如何確定試用期的長度的問題,實際上要解決這個問題,必須將試用期的長度的成本的因素考慮進俱樂部的期望得益的公式中去。一個可行的方法就是對試用期這浪費掉的幾年,按一定概率簽到其他尖子選手的標準算出損失。一般試用期越長,扣除掉的就越多。2023/7/20287.4.1空口聲明的信號作用信號博弈的根本特征是信號發出方的行為對信號接收方來說具有一定程度上以某種方式反映發出方類型的信號作用。在本節討論,信號較完全的博弈方通過某種機制給信息不完全的博弈方傳送信息,后者根據前者所傳來的信號及自己的判斷進行決策。但是,本節的博弈中發出信號的一方并不是通過實際的經濟或其他行為來發出、傳遞信號,而只是通過不需花費任何代價的簡單的“空口聲明”發出,即只傳遞關于自己類型的信號。2023/7/20297.4.1空口聲明的信號作用空口聲明既沒有代價,也不會直接形成、影響產出,對各博弈方的得益不會有直接影響,它對博弈結果和得益的影響是通過影響聽到聲明的接收方的行為而間接造成的。而且我們沒有辦法肯定空口聲明的一方的話是否真實。在這種博弈中,信號發出方所作的只是聲明自己的類型,而信號接收方是唯一的有實質性行為的一方,因此我們將前者稱為“聲明方”,后者稱為“行為方”。2023/7/20307.4.1空口聲明的信號作用空口聲明要起到信號作用一定要滿足的條件:不同類型的聲明方必須要偏好行為方的不同行為。對不同類型的聲明方,行為方愿意采取的行動必須不同。行為方偏好采取的行為不能與聲明方希望行為方采取的行為完全相反。2023/7/20317.4.2空口聲明博弈類型一般的,一個聲明方有有限種(設為I)類型,行為方有有限種(設為K種)行為的空口聲明博弈可以通過下述方法表示:自然抽取聲明方的類型ti抽取的方法是從類型集合中以概率隨機抽取,。聲明方了解自己的類型ti以后,從T中選擇tj作為自己的聲明(tj

可以和ti相等或是不等)。2023/7/20327.4.2空口聲明博弈類型3.行為方聽到tj,然后從可選的行為集合中選擇行為ak。4.雙方得益分別為us(ti,ak)和uR(ti,ak)由于空口聲明博弈與信號博弈在形式上非常相似,差別不過是聲明方的行為比較特殊,且該行為對雙方得益都無直接影響,因此這兩種博弈的完美貝葉斯均衡也幾乎是相同的。2023/7/20337.4.3連續區間類型空間和部分合并均衡設聲明方的類型標準分布于區間T=[0,1],且行為方的行為空間也是A=[0,1],即都可以是這個區間上的任意實數。聲明方的得益函數:us(t,a)=-[a-(t+b)]2,行為方的得益函數:Ur(t,a)=-(a-t)2。

2023/7/20347.4.3連續區間類型空間和部分合并均衡容易看出,當聲明方的類型是t時,聲明方最希望行為方是a=t+b,但是行為方此時對自己最有利的是a=t,即雙方最希望的行為都是t的函數;另外雙方的偏好不是完全對立的,但也不是完全一致的,差異是常數b。

設b>0,那么b越小,雙方的偏好越接近;反之,偏好差距越大,當b接近于0時,雙方的偏好趨于一致,而行為方也差不多可以完全相信聲明方所聲明的類型,這是開口聲明的信號作用最強。2023/7/20357.4.3連續區間類型空間和部分合并均衡克魯福特和索貝爾證明了當b≠0時,該博弈模型存在一種“部分合并均衡”的完美貝葉斯均衡。這種均衡的基本特征是類型空間[0,1]被分成n個區間[0,x1),[x1,x2),…,[xn-1,1],屬于同一區間中類型的聲明方都作同樣的聲明,而在不同區間中類型的聲明方都作不同的聲明。正因為這種均衡中聲明方是分組采用合并均衡策略,所以稱為“部分合并均衡”。2023/7/20367.5不對稱信息下的討價還價廠商和工會之間關于工資談判和討

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論