新《博弈與決策》期末復習指導_第1頁
新《博弈與決策》期末復習指導_第2頁
新《博弈與決策》期末復習指導_第3頁
新《博弈與決策》期末復習指導_第4頁
新《博弈與決策》期末復習指導_第5頁
免費預覽已結束,剩余14頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

新《博弈與決策》期末復習指導新《博弈與決策》期末復習指導新《博弈與決策》期末復習指導V:1.0精細整理,僅供參考新《博弈與決策》期末復習指導日期:20xx年X月第一章博弈論的基本理論(一)博弈論的基本概念博弈:現實生活中,不同的決策人為了爭奪資源、爭奪機會使得決策人處于相互依存的復雜關系中,這就不得不思考他人有針對性行為對自身所產生的影響。博弈就是一種游戲,在這種狀態下,參與者必須作出選擇,并對對方的選擇作出判斷,這種判斷和選擇決定了博弈的結果。每個對弈者在決定采取何種行動時不但要根據自身的利益和目的行事,也要考慮自身的決策行為對其他人的可能影響,以及其他人的行為對自身的可能影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。博弈論:就是以參與人之間有針對性的行為產生的互動過程為研究對象的理論,探討在互動過程中參與人的一般行為規律。博弈論的核心問題在于如何在“策略互動”的局勢中找到局中人的最佳行為方式,使得采用最佳行為方式的局中人能獲得最大的收益。所以博弈論可以簡單理解尾研究策略互動局勢中的局中人的理性行為的理論。(二)博弈論的構成要素1、博弈一般由以下幾個要素組成,包括:參與人、行動、信息、策略、得益、結果、均衡等。2、參與人指的是博弈中選擇行動以最大化自己效用的決策主體(可以是個人,也可以是團體);3、行動是指參與人在博弈進程中輪到自己選擇時所作的某個具體決策;4、策略是指參與人選擇行動的規則,即在博弈進程中,什么情況下選擇什么行動的預先安排;5、得益是參與人在博弈結束后從博弈中獲得的效用,一般是所有參與人的策略或行動的函數,這是每個參與人最關心的東西;6、均衡是所有參與人的最優策略或行動的組合;均衡結果是指博弈結束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動或效用集合。上述要素中,參與人、行動、結果統稱為博弈規則,博弈分析的目的就是使用博弈規則來決定均衡。二、博弈論的發展簡史1、萌芽階段:博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。2、產生階段:1944年科學家馮·諾伊曼和經濟學家奧斯卡·摩根斯坦合著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統的應用于經濟領域,標志著博弈論作為一門獨立的的學科誕生。3、發展階段:1950年,約翰·納什(JohnNash)引入均衡(解)的概念,即納什均衡,將博弈論從零和博弈推進到非零和博弈(即參與人會出現雙贏或雙輸的情況),納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。納什獲得1994年諾貝爾經濟學獎。4、高潮階段:20世紀40年代末到50年代中期是博弈論研究的第一個高潮時期,一方面是合作博弈發展到了鼎盛時期,包括納什和夏普里的“討價還價”模型,“核”的概念。另一方面非合作博弈開始創立,納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)以及Tucker于1950年定義的“囚徒困境”。這一時期海提出了“微分博弈”,奧曼提出了“強均衡”概念,“重復博弈”也開始研究。1965年和1975年蘭哈德·澤爾藤(ReinhardSelten)把納什均衡推廣到動態博弈,并提出子博弈完美納什均衡;1967-1968年間,約翰·海薩尼(JohnHarsanyi)把納什思想推廣到不完全信息模型,提出貝葉斯均衡;他們與納什一起分享1994年諾貝爾經濟學獎。1996年諾貝爾經濟學獎獲得者詹姆斯·莫里斯教授和威廉姆·維克瑞教授在20世紀60、70年代提示不對稱信息對交易帶來的影響,并提出相應對策。70年代的重要事件海包括“進化博弈論”,“進化穩定策略”,此外“共同知識”也引起了廣泛關注。5、成熟階段:80、90年代是博弈論于駐留經濟學融合時期,也是博弈論走向成熟時期。這個時期最重要的進展包括ElonKohlbergZAI1981年引入“前向歸納法”,克里普斯和威爾遜在982年提出“序列均衡”,斯密1982年出版《進化和博弈論》,海薩尼和澤爾藤在988年提出有關非合作博弈中均衡選擇的一般理論和標準。1991年佛德伯格和泰勒提出了“精練貝葉斯均衡”。三、博弈論的分類1、參與人行動的先后順序:靜態和動態靜態博弈是指參與者同時采取行動,或者盡管參與者行動的采取有先后順序,但后行動的人不知道先采取行動的人采取的是什么行動。動態博弈:參與者的行動有先后順序,并且后采取行動的人可以知道先采取行動的人所采取的行動。2、參與人對其他參與人的了解程度:完全信息和不完全信息完全信息博弈:參與者對所有參與者的特征、策略空間及策略組合下的支付有充分了解稱為完全信息;不完全信息博弈:參與者對所有參與者的特征、策略空間及策略組合下的支付的信息了解得不夠準確或者不是對所有參與者的特征、策略空間及策略組合下的支付的信息都有準確的了解。3、參與人之間是否進行合作:合作和非合作合作性博弈:參與者從自己的利益出發與其他參與者談判達成協議或形成聯盟,其結果對聯盟方均有利;參與人在協議范圍內進行博弈。非合作性博弈:參與者在行動選擇時無法達成約束性的協議4、非合作博弈四種類型及對應的均衡:(1)完全信息靜態——納什均衡、占優均衡納什均衡是指這樣一種均衡:在這一均衡中,每個博弈參與人都確信,在給定其他參與人戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。也就是說,所有人的戰略都是最優的。占優均衡指不論其他參與者做何種策略選擇,每個參與者的最佳策略都是唯一的,其結果為占優均衡。當所有博弈者都有一個占優戰略時,其結果將是占優均衡。占優均衡一定是納什均衡。(2)完全信息動態——子博弈精煉納什均衡子博弈精煉納什均衡是澤爾騰(Selten)于1965年首先提出的,其目的是將那些不可置信威脅策略的納什均衡從均衡中剔除,從而給出動態博弈一個合理的均衡解。在動態博弈中,參與人的行動有先后順序,后行動的參與人在自己行動之前就可以觀察到先行動者(參與人)的行為,并在此基礎上選擇相應的策略。而且,由于先行動者擁有后行動者可能選擇策略的完全信息,因而先行動者在選擇自己的策略時,就可以預先考慮自己的選擇對后行動者選擇的影響,并采取相應的對策。(3)不完全信息靜態博弈——貝葉斯納什均衡貝葉斯納什均衡:在不完全信息靜態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。給定其他參與人的戰略選擇,每個參與人的最優戰略依賴于自己的類型。由于每個參與人僅知道其他參與人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什么戰略。但是,他能夠正確地預測到其他參與人的選擇與其各自的有關類型之間的關系。因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。貝葉斯納什均衡是一種類型依賴型戰略組合。(4)不完全信息動態博弈——精煉貝葉斯納什均衡精煉貝葉斯納什均衡:在不完全信息動態博弈中博弈開始時,某一參與人既不知道其他參與人的真實類型,也不知道其他參與人所屬類型的分布概率。他只是對這一概率分布有自己的主觀判斷,即有自己的信念。博弈開始后,該參與人將根據他所觀察到的其他參與人的行為,來修正自己的信念。并根據這種不斷變化的信念,作出自己的戰略選擇。第二章簡單博弈與博弈均衡(一)占優戰略與占優戰略均衡占優戰略是博弈論(gametheory)中的專業術語,所謂的占優戰略就是指無論競爭對手如何反應都屬于本企業最佳選擇的競爭策略。占優戰略均衡必定是納什均衡,因為局中人的占優戰略是對所有其他局中人的任何戰略組合情況下的最優戰略選擇,自然它也一定是對于所有其他局中人的某個特定戰略(其他局中人的最優戰略)情況下的最優戰略選擇。但反過來不成立,納什均衡不一定是占優戰略均衡。(二)納什戰略均衡1、納什均衡的意義:納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,其重要影響可以概括為以下六個方面:(1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究范式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。(2)擴展了經濟學研究經濟問題的范圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。(3)加強了經濟學研究的深度。納什均衡理論不回避經濟個體之間直接的交互作用,不滿足于對經濟個體之間復雜經濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。(4)形成了基于經典博弈的研究范式體系。即可以將各種問題或經濟關系,按照經典博弈的類型或特征進行分類,并根據相應的經典博弈的分析方法和模型進行研究,將一個領域所取得的經驗方便地移植到另一個領域。(5)擴大和加強了經濟學與其他社會科學、自然科學的聯系。納什均衡理論既適用于人類的行為規律,也適合于人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯系更加緊密,形成了經濟學與其他學科相互促進的良性循環。(6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(PaulSamuelson)的名言“你甚至可以使一只鸚鵡變成一個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。2、占優戰略均衡和納什均衡的聯系與區別:納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語。在這一均衡中,每個博弈參與人都確信,在給定其他參與人戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。也就是說,所有人的戰略都是最優的。占優戰略是博弈論(gametheory)中的專業術語,所謂的占優戰略就是指無論競爭對手如何反應都屬于本企業最佳選擇的競爭策略。占優戰略均衡必定是納什均衡,因為局中人的占優戰略是對所有其他局中人的任何戰略組合情況下的最優戰略選擇,自然它也一定是對于所有其他局中人的某個特定戰略(其他局中人的最優戰略)情況下的最優戰略選擇。但反過來不成立,納什均衡不一定是占優戰略均衡。顯然,占優戰略均衡是重復剔除的占優戰略均衡的一種特例第三章重復博弈與序列博弈一、重復博弈重復博弈中的“針鋒相對”策略博弈重復博弈是指同一個博弈在相同的環境、規則下反復多次執行的博弈問題。重復博弈最好的策略十分簡單,只要將一個原則貫穿始終,即“針鋒相對”。這一策略的獲勝有一個十分重要的條件,即博弈是無限次重復的。也就是說,對局者都預期這一博弈將永遠持續下去而不會停止。如果對局的次數是有限的話,上述結論將不再有效。二、序列博弈序列博弈是指對局者選擇策略有時間先后的順序,某些對局者可能率先采取行動。序列博弈也是一種動態博弈。在序列博弈中,先行者可能占據一定的有利地位,我們把它叫作先行者優勢。在某些市場中,特別在涉及市場進入的競爭時,先行者優勢對于企業的經營具有重要意義。第四章博弈論在企業經濟管理決策中的應用一、“保證最低價格”的策略重點掌握保證最低價格策略條款內容:該條款規定,顧客在本商店購買這種商品一個月內,如果發現其他任何商店比本店更低價格出售同樣的商品,本店將退還差價,并補償差額的10%。對消費者來說,保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買,但這種條款無疑是企業之間競爭的一種手段。假定推行保證最低價格條款的商店為商店A,它的競爭者為商店B。當商店A把某產品定為5000元并推行保證最低價格條款的時候,商店B應如何定價最為有利呢如果商店B高于5000元,顯然對其競爭不利,因為除非顧客不了解情況,否則他們將到商店A去購買該產品。如果商店的定價低于5000元,它能否因此而爭取到更多的顧客呢不能,因為商店A已經有了保證最低價格的條款。這樣,對商店B來說,它的最優的定價策略就是與商店A制定同樣的價格。

再如,如果你在該商店花5000元購買了一架尼康相機,一周后你在另一家商店發現那里只賣4500元,那么你就可以向該商店交涉,并獲得550元的退款。對消費者來說,保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買,但這種條款無疑是企業之間競爭的一種手段。證最低價格條款是一種承諾,由于法律的限制,商店在向消費者公布了這一條款之后是不能不實行的,因此它是絕對可信的。這一承諾隱含著商店A向商店B發出的不要降價競爭的威脅,并使這種威脅產生其預期的效果。二、擴大生產能力策略壟斷者為阻止潛在進入者進入市場,壟斷者可能對潛在進入者進行威脅。但壟斷者的這種威脅是否能達到阻止進入的目的,取決于其承諾。所謂承諾,是指對局者所采取的某種行動,這種行動使其威脅成為一種令人可信的威脅。那么,一種威脅在什么條件下會變得令人可信呢?一般是,只有當對局者在不實行這種威脅會遭受更大損失的時候。與承諾行動相比,空頭威脅無法有效阻止市場進入的主要原因是,它是不需要任何成本的。發表聲明是容易的,僅僅宣稱將要作什么或者標榜自己是說一不二的人也都缺乏實質性的涵義。因此,只有當對局者采取了某種行動,而且這種行動需要較高的成本,才會使威脅變得可信。三、限制進入定價策略限制進入定價是指現有企業通過收取低于進入發生的價格的策略來防范進入。潛在進入者看到這一低價后,推測出進入后價格也會那么低甚至更低,因而進入該市場終將無利可圖。四、掠奪性定價策略掠奪性定價是指將價格設定為低于成本,而期望由此發生的損失在新進入企業或者競爭對手被逐出市場后,掠奪企業能夠行使市場權力時可能得到補償。這也是一種價格報復策略。掠奪性定價與限制定價之間的差異在于,限制定價是針對那些尚未進入市場的企業,是想較長一段時間內維持低價來限制新企業的進入。而掠奪性定價則將矛頭指向已經進入的企業或即將來臨之際。囚徒困境分析:每個博弈方選擇自己的策略時,雖然無法知道另一方的實際選擇,但他卻不能忽視另一方的選擇對他自己的得益的影響,因此他應該考慮到另一方有兩種可能的選擇,并分別考慮自己相應的最佳策略。對囚徒A來說,囚徒B有坦白和不坦白兩種可能的選擇,假設囚徒B的選擇是不坦白,則對囚徒A來說,不坦白得益為-1,坦白得益為0,他應該選擇坦白;1,1,18,0不坦白0,85,5坦白嫌疑犯乙不坦白坦白嫌疑犯甲所以最可能的結局:該博弈的最終結果是兩博弈方同選擇坦白策略。其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論