




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
<<博弈論與信息經(jīng)濟(jì)學(xué)>>課件<<博弈論與信息經(jīng)濟(jì)學(xué)>>課件何為博弈?何為博弈?Ifagroupofhunterssetouttotakeastag,theyarefullyawarethattheywouldallhavetoremainfaithfullyattheirpostsinordertosucceed;butifaharehappenstopassnearoneofthem,therecanbenodoubtthathepursueditwithoutqualm,andthatoncehehadcaughthisprey,hecaredverylittlewhetherornothehadmadehiscompanionsmisstheirs.——RousseauIfagroupofhunterssetou博弈與博弈論Game:aphysicalormentalcompetitionconductedaccordingtoruleswiththeparticipantsindirectoppositiontoeachother.——Merriam-WebsterReferences博,大通也。——《說(shuō)文》。弈,圍棋,通“奕”。博弈飽食終日,無(wú)所用心,難矣哉。不有博弈者乎?為之尤賢乎己!——論語(yǔ)·陽(yáng)貨篇博弈與博弈論Game:aphysicalorment博弈:是對(duì)理性的參與人在策略相互依存情況下的行為所進(jìn)行的正規(guī)的描述。博弈論:是研究決策主體的行為發(fā)生相互作用時(shí)的決策以及相對(duì)應(yīng)的均衡問(wèn)題的經(jīng)濟(jì)學(xué)理論。博弈與博弈論博弈:是對(duì)理性的參與人在策略相互依存情況下的行為所進(jìn)行的正規(guī)為什么要學(xué)習(xí)博弈論?是經(jīng)濟(jì)學(xué)理論發(fā)展的自然延伸是學(xué)習(xí)經(jīng)濟(jì)學(xué)前沿理論的重要工具是從事科研工作的思維方式之一是理解制度、文化等非傳統(tǒng)經(jīng)濟(jì)學(xué)問(wèn)題的有效途徑為什么要學(xué)習(xí)博弈論?1994年
約翰·福布斯·納什(JohnF.NashJr.)美國(guó)人(1928-2015)
約翰·海薩尼(JohnC.Harsanyi)美國(guó)人(1920-)
萊因哈德·澤爾騰(ReinhardSelten)德國(guó)人(1930-)
這三位數(shù)學(xué)家在非合作博弈的均衡分析理論方面做出了開(kāi)創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。
1994年1996年詹姆斯·莫里斯(JamesA.Mirrlees)英國(guó)人(1936-)。主要著作:《關(guān)于福利經(jīng)濟(jì)學(xué)、信息和不確定性的筆記》《道德風(fēng)險(xiǎn)理論與不可觀測(cè)行為》《組織內(nèi)激勵(lì)和權(quán)威的最優(yōu)結(jié)構(gòu)》威廉·維克瑞(WilliamVickrey)美國(guó)人(1914-1996)
維克瑞在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。
1996年2001年喬治·阿克爾洛夫(GeorgeA.Akerlof)生于1940年,美國(guó)加州大學(xué)伯克萊分校邁克爾·斯賓塞(A.MichaelSpence)生于1943年,美國(guó)加州斯坦福大學(xué)約瑟夫·斯蒂格利茨(JosephE.Stiglitz)生于1943年,美國(guó)紐約哥倫比亞大學(xué)為不對(duì)稱信息市場(chǎng)的一般理論奠定了基石。他們的理論迅速得到了應(yīng)用,從傳統(tǒng)的農(nóng)業(yè)市場(chǎng)到現(xiàn)代的金融市場(chǎng)。他們的貢獻(xiàn)來(lái)自于現(xiàn)代信息經(jīng)濟(jì)學(xué)的核心部分2001年2004年
芬恩·基德蘭德(FinnE.Kydland)卡內(nèi)基—梅隆大學(xué)和加利福尼亞圣巴巴拉分校愛(ài)德華·普雷斯科特(EdwardC.Prescott)亞利桑那州立大學(xué)凱瑞(W.P.Carey)商學(xué)院他們一是通過(guò)對(duì)宏觀經(jīng)濟(jì)政策運(yùn)用中“時(shí)間一致性難題”的分析研究,為經(jīng)濟(jì)政策特別是貨幣政策的實(shí)際有效運(yùn)用提供了思路;二是在對(duì)商業(yè)周期的研究中,通過(guò)對(duì)引起商業(yè)周期波動(dòng)的各種因素和各因素間相互關(guān)系的分析,使人們對(duì)于這一現(xiàn)象的認(rèn)識(shí)更加深入。2004年2005年托馬斯·克羅姆比·謝林(ThomasCrombieSchelling),1921年生于美國(guó)。哈佛大學(xué)博士。現(xiàn)任馬里蘭大學(xué)教授。羅伯特·約翰·奧曼(RobertJohnAumann),1930年生于德國(guó)。麻省理工學(xué)院博士。耶路撒冷希伯來(lái)大學(xué)教授。通過(guò)博弈論分析促進(jìn)了對(duì)沖突與合作的理解。2005年2007年埃里克·馬斯金(EricS.Maskin)普林斯頓高等研究院社會(huì)科學(xué)部主任。他在現(xiàn)代經(jīng)濟(jì)學(xué)最為基礎(chǔ)的領(lǐng)域里做出了卓越的貢獻(xiàn),其中包括公共選擇理論、博弈論、激勵(lì)理論與信息理論以及機(jī)制設(shè)計(jì)。被譽(yù)當(dāng)今國(guó)際經(jīng)濟(jì)學(xué)最受尊敬的經(jīng)濟(jì)學(xué)大師。羅杰·邁爾森(RogerB.Myerson)1951年3月29日生于美國(guó)波士頓,美國(guó)國(guó)籍。1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位,其博士課題為“一種合作博弈理論(ATheoryofCooperativeGames)”,對(duì)博弈論有深入的研究。著有《博弈論:矛盾沖突分析》(GameTheory:AnalysisofConflict)及《經(jīng)濟(jì)決策的概率模型》(ProbabilityModelsforEconomicDecisions)。萊昂尼德·赫維奇(LeonidHurwicz)美國(guó)科學(xué)院院士,美國(guó)經(jīng)濟(jì)學(xué)會(huì)院士,總統(tǒng)獎(jiǎng)獲得者。最重要的研究工作是開(kāi)創(chuàng)了經(jīng)濟(jì)機(jī)制設(shè)計(jì)理論。他曾于1990年由于“對(duì)現(xiàn)代分散分配機(jī)制的先鋒性研究”獲得美國(guó)國(guó)家科學(xué)獎(jiǎng)。2007年2009年埃莉諾·奧斯特羅姆(ElinorOstrom)是印第安那大學(xué)政治學(xué)系阿瑟·本特利講座教授。她對(duì)制度分析理論、集體行動(dòng)理論、可持續(xù)發(fā)展、公共資源等領(lǐng)域的研究在全世界范圍內(nèi)產(chǎn)生了很大的影響,并因而獲得了眾多的榮譽(yù)。她的獲獎(jiǎng)理由是對(duì)經(jīng)濟(jì)治理(economicgovernance)的研究,特別是在公共選擇方面的研究,奧斯特姆的研究證明了用戶組織(userassociations)如何成功管理公共財(cái)產(chǎn)。《規(guī)則、博弈與公共池塘資源》《共同合作——集體行為、公共資源與實(shí)踐中的多元方法》《民主的意義及民主制度的脆弱性》2009年2012年埃爾文·羅斯(AlvinRoth)與羅伊德·沙普利(LloydShapley)。2012年2014年讓·梯若爾(JeanTirole),因在“對(duì)市場(chǎng)力量和監(jiān)管的分析”方面的貢獻(xiàn)而獲獎(jiǎng)。2014年為什么要學(xué)習(xí)博弈論?在博弈論中,優(yōu)超戰(zhàn)略均衡(DominantStrategyEquilibrium)總是納什均衡么?納什均衡總是優(yōu)超戰(zhàn)略均衡么?——北京大學(xué)1996年研究生入學(xué)考試試題考慮Spence的signal模型。市場(chǎng)上有高能力和低能力兩類(lèi)工人,高能力工人的生產(chǎn)效率為2,低能力的為1;且高能力工人接受y年教育的成本y/2,低能力工人接受y年教育的成本y。假設(shè)雇主可使工人的效用達(dá)到最低限為零,雇主不能觀察能力的大小,只能認(rèn)為每個(gè)工人為高能力的概率為1/2。如果受教育程度可觀察,求信號(hào)的分離均衡和混同均衡。——北京大學(xué)2005年研究生入學(xué)考試試題為什么要學(xué)習(xí)博弈論?在博弈論中,優(yōu)超戰(zhàn)略均衡請(qǐng)用博弈論思想簡(jiǎn)述中國(guó)為什么要加入世界貿(mào)易組織?——對(duì)外經(jīng)貿(mào)大學(xué)2002年研究生入學(xué)考試試題寡頭壟斷市場(chǎng)上有一種決策方式被稱為“準(zhǔn)競(jìng)爭(zhēng)”(quasi-competitive),其含義是市場(chǎng)上所有的寡頭壟斷企業(yè)都模仿完全競(jìng)爭(zhēng)廠商的行為模式,使生產(chǎn)的邊際成本(MC)等于市場(chǎng)價(jià)格(P)。假定市場(chǎng)上有n個(gè)相同的賣(mài)方壟斷生產(chǎn)廠商,他們所面對(duì)的反需求函數(shù)為P=a-b(q1+······+qn),其成本為Ci=cqi。求:(1)古諾均衡解;(2)確定準(zhǔn)均衡解;(3)當(dāng)n→∞時(shí),古諾解是否收斂于準(zhǔn)競(jìng)爭(zhēng)解?——中國(guó)人民大學(xué)2004年研究生入學(xué)考試試題為什么要學(xué)習(xí)博弈論?請(qǐng)用博弈論思想簡(jiǎn)述中國(guó)為什么要加入世界貿(mào)易組主父欲伐中山,使李疵觀之。李疵曰:“可伐也!君弗攻,恐后天下。”主父曰:“何以?”對(duì)曰:“中山之君所傾蓋與車(chē)(古人乘車(chē)與人交談,必須傾斜車(chē)蓋),而朝窮閭(lǘ)隘巷之士者,七十家。”主父日:“是賢君也,安可伐?”李疵曰:“不然。舉士,則民務(wù)名不存本;朝賢,則耕者惰而戰(zhàn)士懦。若此不亡者,未之有也。”主父欲伐中山,使李疵觀之。李疵曰:“可伐也!教材選擇教材選擇課程內(nèi)容設(shè)置一、博弈論的基本理論完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈重復(fù)博弈
演化博弈合作博弈論簡(jiǎn)介
不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈二、信息經(jīng)濟(jì)學(xué)初步三、制度經(jīng)濟(jì)學(xué)的博弈研究課程內(nèi)容設(shè)置一、博弈論的基本理論完全信息靜態(tài)博弈學(xué)習(xí)過(guò)程中的注意事項(xiàng)一、注重理解和思考二、一定要做一定數(shù)量的習(xí)題三、超越符號(hào)四、把握各種定義公式背后的含義學(xué)習(xí)過(guò)程中的注意事項(xiàng)一、注重理解和思考學(xué)習(xí)方法,重要!博學(xué)之,少看課件;審問(wèn)之,突破常識(shí);慎思之,由淺入深;明辨之,碰撞思想;篤行之,筆耕不輟。學(xué)習(xí)方法,重要!博學(xué)之,少看課件;第1章博弈基本構(gòu)成要素與表示方法第1章博弈基本構(gòu)成要素與表示方法本章導(dǎo)引第1節(jié)博弈的基本構(gòu)成要素參與人、行動(dòng)、信息、策略、支付和均衡。第2節(jié)博弈的展開(kāi)式表示第3節(jié)博弈的標(biāo)準(zhǔn)式表示博弈樹(shù):結(jié)點(diǎn)、枝、信息集。策略與支付矩陣。本章導(dǎo)引第1節(jié)博弈的基本構(gòu)成要素參與人、行動(dòng)、信息第1節(jié)博弈基本構(gòu)成要素
案例:開(kāi)發(fā)商A欲開(kāi)發(fā)一棟新的寫(xiě)字樓,他面臨著兩方面的不確定性。一是房地產(chǎn)市場(chǎng)的需求存在不確定性,對(duì)寫(xiě)字樓的需求可能很高的需求也可能很低;另一方面,存在另外一個(gè)開(kāi)發(fā)商B也有可能開(kāi)發(fā)類(lèi)似的寫(xiě)字樓。所以可能出現(xiàn)的結(jié)果有以下八種:需求旺盛,A開(kāi)發(fā),B放棄,則A的利潤(rùn)為8000萬(wàn),B的利潤(rùn)為0;B開(kāi)發(fā),則A的利潤(rùn)為4000萬(wàn),B的利潤(rùn)為4000萬(wàn);
A放棄,B開(kāi)發(fā),則A的利潤(rùn)為0,B的利潤(rùn)為8000萬(wàn);B放棄,則A的利潤(rùn)為0,B的利潤(rùn)為0;需求萎靡,A開(kāi)發(fā),B放棄,則A的利潤(rùn)為1000萬(wàn),B的利潤(rùn)為0;B開(kāi)發(fā),則A的利潤(rùn)為-3000萬(wàn),B的利潤(rùn)為-3000萬(wàn);A放棄,B開(kāi)發(fā),則A的利潤(rùn)為0,B的利潤(rùn)為1000萬(wàn);B放棄,則A的利潤(rùn)為0,B的利潤(rùn)為0;第1節(jié)博弈基本構(gòu)成要素案例:開(kāi)發(fā)商A欲開(kāi)一、參與人(player)參與人是搏弈中的決策主體,其目的是使自己的效用最大化。界定:參與人必須有可供選擇的行動(dòng)和很好定義的效用函數(shù)。限制:“自然”
(nature)作為“虛擬參與人”(pseudo-player)在博弈中出現(xiàn)。自然可以理解為決定外生隨機(jī)變量概率分布的機(jī)制。特例:符號(hào):i=1,2,···,n代表參與人;N或0代表“自然”。第1節(jié)博弈基本構(gòu)成要素一、參與人(player)參與人是搏弈中的決策主體,其目的是二、行動(dòng)(actionormove)行動(dòng)是參與人在某個(gè)時(shí)點(diǎn)時(shí)的決策變量。界定:ai表示參與人的某一個(gè)行動(dòng);符號(hào):Ai={ai}表示可供參與人i選擇的所有行動(dòng)的集合,或稱行動(dòng)空間;a=(a1,a2,···,an)表示n個(gè)參與人行動(dòng)的有序集,稱為“行動(dòng)組合”(actionprofile);行動(dòng)順序(theorderofplay)很重要注意:第1節(jié)博弈基本構(gòu)成要素二、行動(dòng)(actionormove)行動(dòng)是參與人在某個(gè)時(shí)三、信息(information)信息是參與人擁有的有關(guān)博弈的知識(shí)。尤其是與(1)“自然”的選擇,
(2)其他參與人的特征以及(3)行動(dòng)的知識(shí)。界定:如果在一個(gè)二人博弈中,一個(gè)事實(shí)F能夠滿足如下條件,那么它就是一個(gè)“共同知識(shí)”(commonknowledge):注意:(1)參與人1和2知道F;(2)參與人1和2知道“參與人1和2知道F”;(3)參與人1和2知道“參與人1和2知道參與人1和2知道F”;
……第1節(jié)博弈基本構(gòu)成要素三、信息(information)信息是參與人擁有的有關(guān)博弈
黔無(wú)驢,有好事者船載以入。至則無(wú)可用,放之山下。/虎見(jiàn)之,龐然大物也,以為神,蔽林間窺之。稍出近之,慭(yìn)慭然,莫相知。/他日,驢一鳴,虎大駭,遠(yuǎn)遁;以為且噬己也,甚恐。然往來(lái)視之,覺(jué)無(wú)異能者;益習(xí)其聲,又近出前后,終不敢搏。/稍近益狎,蕩倚沖冒。驢不勝怒,蹄之。虎因喜,計(jì)之曰,“技止此耳!”因跳踉大,斷其喉,盡其肉,乃去。參與人的特征往往是與其行為緊密相關(guān)的。注意:黔之驢黔無(wú)驢,有好事者船載以入。至則無(wú)可用,放之山下。/虎四、策略或戰(zhàn)略(strategy)策略是參與人的一個(gè)完備(complete)的相機(jī)(contingent)決策規(guī)則。界定:符號(hào):si表示參與人的某一個(gè)策略;Si={si}表示所有可供參與人i選擇的策略的集合;s=(s1,···,si,···,sn)是一個(gè)n維向量,被稱為“策略組合”(actionprofile);s-i=(s1,···,si-1,si+1,···,sn)表示策略組合s中除了i之外的其他人的選擇。因此s也可以寫(xiě)作s=(si,s-i)第1節(jié)博弈基本構(gòu)成要素四、策略或戰(zhàn)略(strategy)策略是參與人的一個(gè)完備(c五、支付(payoff)支付是指在一個(gè)特定的策略組合下得到的效用水平。界定:符號(hào):ui=ui(s)=ui(s1,···,si,···,sn)表示參與人i從策略組合s中所獲得的支付(效用)第1節(jié)博弈基本構(gòu)成要素五、支付(payoff)支付是指在一個(gè)特定的策略組合下得到的第2節(jié)博弈的展開(kāi)式表示第2節(jié)博弈的展開(kāi)式表示第2節(jié)博弈的展開(kāi)式表示——博弈樹(shù)的構(gòu)成GIRLBOYBGGSFSFSF55215512第2節(jié)博弈的展開(kāi)式表示——博弈樹(shù)的構(gòu)成GIRLBOYBGGSFSFSFBG55215512第2節(jié)博弈的展開(kāi)式表示GSFSFSFBG5251第2節(jié)博弈的展開(kāi)式表示
案例:開(kāi)發(fā)商A欲開(kāi)發(fā)一棟新的寫(xiě)字樓,他面臨著兩方面的不確定性。一是房地產(chǎn)市場(chǎng)的需求存在不確定性,對(duì)寫(xiě)字樓的需求可能很高的需求也可能很低;另一方面,存在另外一個(gè)開(kāi)發(fā)商B也有可能開(kāi)發(fā)類(lèi)似的寫(xiě)字樓。所以可能出現(xiàn)的結(jié)果有以下八種:第2節(jié)博弈的展開(kāi)式表示需求旺盛,A開(kāi)發(fā),B放棄,則A的利潤(rùn)為8000萬(wàn),B的利潤(rùn)為0;B開(kāi)發(fā),則A的利潤(rùn)為4000萬(wàn),B的利潤(rùn)為4000萬(wàn);
A放棄,B開(kāi)發(fā),則A的利潤(rùn)為0,B的利潤(rùn)為8000萬(wàn);B放棄,則A的利潤(rùn)為0,B的利潤(rùn)為0;需求萎靡,A開(kāi)發(fā),B放棄,則A的利潤(rùn)為1000萬(wàn),B的利潤(rùn)為0;B開(kāi)發(fā),則A的利潤(rùn)為-3000萬(wàn),B的利潤(rùn)為-3000萬(wàn);A放棄,B開(kāi)發(fā),則A的利潤(rùn)為0,B的利潤(rùn)為1000萬(wàn);B放棄,則A的利潤(rùn)為0,B的利潤(rùn)為0;案例:開(kāi)發(fā)商A欲開(kāi)發(fā)一棟新的寫(xiě)字樓,他面臨著A開(kāi)發(fā)放棄N大1/2小1/2B開(kāi)發(fā)放棄4480開(kāi)發(fā)放棄-3-310B開(kāi)發(fā)N大小1/21/2放棄開(kāi)發(fā)放棄08000100BB第2節(jié)博弈的展開(kāi)式表示A開(kāi)發(fā)放棄N大1/2小1/2B開(kāi)發(fā)放棄48開(kāi)發(fā)放棄-31B開(kāi)A開(kāi)發(fā)放棄N大1/2小1/2B放棄4480開(kāi)發(fā)放棄-3-310開(kāi)發(fā)N大小1/21/2放棄開(kāi)發(fā)放棄08000100BBB開(kāi)發(fā)自然的行動(dòng)無(wú)法觀察到的情況第2節(jié)博弈的展開(kāi)式表示A開(kāi)發(fā)放棄N大1/2小1/2B放棄48開(kāi)發(fā)放棄-31開(kāi)發(fā)N大A開(kāi)發(fā)放棄N大1/2小1/2B放棄4480開(kāi)發(fā)放棄-3-310開(kāi)發(fā)N大小1/21/2放棄開(kāi)發(fā)放棄08000100BBB開(kāi)發(fā)參與人A的行動(dòng)無(wú)法觀察到的情況第2節(jié)博弈的展開(kāi)式表示A開(kāi)發(fā)放棄N大1/2小1/2B放棄48開(kāi)發(fā)放棄-31開(kāi)發(fā)N大第2節(jié)博弈的展開(kāi)式表示練習(xí):要挾訴訟參與人:一個(gè)原告(P)和一個(gè)被告(D)博棄順序:
(1)原告決定是否指控被告,指控的成本是c;
(2)原告提出一個(gè)無(wú)協(xié)商余地的賠償金額s
>0以私了;
(3)被告決定接受或拒絕原告的要求;
(4)如果被告拒絕原告的要求,原告將決定是放棄還是上法庭,自己的成本是p,給被告帶來(lái)的成本是d;
(5)如果告上法庭,原告以q的概率勝訴而獲得賠償x,(1-q)的概率什么也得不到。第2節(jié)博弈的展開(kāi)式表示練習(xí):要挾訴訟第2節(jié)博弈的展開(kāi)式表示練習(xí):離婚的博弈博弈描述:瓊斯夫人正準(zhǔn)備與瓊斯先生離婚。他們婚前的協(xié)議約定,如果她能證明瓊斯先生有過(guò)外遇就能得到10萬(wàn)美元,反之則只能得到5萬(wàn)美元。她的律師只有雇用私人偵探,才可能證明她丈夫有外遇。雇用私人偵探的費(fèi)用為1萬(wàn)美元,包含在律師費(fèi)中。瓊斯夫人有兩個(gè)選擇:不管訴訟案結(jié)果如何都付給她的律師2萬(wàn)美元,或者支付訴訟收入的1/3。律師只有在有利可圖的情況下才會(huì)雇用私人偵探。第2節(jié)博弈的展開(kāi)式表示練習(xí):離婚的博弈第2節(jié)博弈的展開(kāi)式表示練習(xí):市場(chǎng)入侵博弈描述:某種產(chǎn)品目前由唯一的一家企業(yè)I進(jìn)行壟斷經(jīng)營(yíng)。現(xiàn)在另外一家企業(yè)E1企圖進(jìn)入這個(gè)市場(chǎng)。E1可以選擇單獨(dú)進(jìn)入這個(gè)市場(chǎng);也可以考慮與另外一家企業(yè)E2聯(lián)合進(jìn)入這個(gè)市場(chǎng)。E2擁有某種可以大大降低E1成本的技術(shù),但是E2本身不能單獨(dú)進(jìn)入這個(gè)市場(chǎng)。如果E1向E2發(fā)出聯(lián)合的邀請(qǐng),而E2接受了邀請(qǐng),那么兩家企業(yè)就聯(lián)合進(jìn)入這個(gè)市場(chǎng);而如果E2拒絕,那么E1還是需要考慮是否單獨(dú)進(jìn)入這個(gè)市場(chǎng)。對(duì)于企業(yè)I而言,他能夠發(fā)現(xiàn)有新的企業(yè)進(jìn)入這個(gè)市場(chǎng),但是卻無(wú)法確定進(jìn)入這個(gè)市場(chǎng)的企業(yè)究竟是單獨(dú)的一家企業(yè)還是兩家企業(yè)的聯(lián)合。他必須在容忍對(duì)方的存在和與之進(jìn)行斗爭(zhēng)之間進(jìn)行選擇。第2節(jié)博弈的展開(kāi)式表示練習(xí):市場(chǎng)入侵第2節(jié)博弈的展開(kāi)式表示練習(xí):消耗戰(zhàn)(WarofAttrition)博弈描述:考慮這樣一個(gè)兩階段消耗戰(zhàn)。在博弈的每個(gè)階段,每個(gè)參與者都可以選擇戰(zhàn)斗(F)和退出(Q)。每個(gè)階段的戰(zhàn)略都是同時(shí)制定的。在第1個(gè)階段,如果參與者都退出,他們平分150,每人得到75。如果一個(gè)戰(zhàn)斗另一個(gè)退出,戰(zhàn)斗者得100,退出者得50。如果他們都選擇戰(zhàn)斗,博弈進(jìn)入第2階段,此時(shí)總收益最多為90,因?yàn)榈?階段的沖突耗費(fèi)了一些資源。在第2階段,如果他們還都選擇戰(zhàn)斗,進(jìn)一步的沖突將收益減少為每人得到10。如果一人戰(zhàn)斗一人退出,則戰(zhàn)斗者得55,退出者得15。第2節(jié)博弈的展開(kāi)式表示練習(xí):消耗戰(zhàn)(WarofAttA開(kāi)發(fā)放棄N大1/2小1/2B放棄4480開(kāi)發(fā)放棄-3-310開(kāi)發(fā)N小大1/21/2放棄開(kāi)發(fā)放棄08000100BBB開(kāi)發(fā)對(duì)信息集的限定貸款開(kāi)發(fā)00第2節(jié)博弈的展開(kāi)式表示A開(kāi)發(fā)放棄N大1/2小1/2B放棄48開(kāi)發(fā)放棄-31開(kāi)發(fā)N小不滿足“完美回憶”(PerfectRecall)要求的情形121UDLRLRN12UDUDLRLR1第2節(jié)博弈的展開(kāi)式表示不滿足“完美回憶”(PerfectRecall)要求的情形第3節(jié)博弈的標(biāo)準(zhǔn)式表示第3節(jié)博弈的標(biāo)準(zhǔn)式表示第3節(jié)博弈的標(biāo)準(zhǔn)式(策略式)表示一、策略ALRNG1/2S1/2BD4480UD-3-310XNGS1/21/2YXY08000100BBBU第3節(jié)博弈的標(biāo)準(zhǔn)式(策略式)表示一、策略ALRNG1/2ALRNG1/2S1/2BD4480UD-3-310XNGS1/21/2YXY08000100BBBU第3節(jié)博弈的標(biāo)準(zhǔn)式(策略式)表示ALRNG1/2S1/2BD48UD-31
以z表示某一個(gè)終點(diǎn)結(jié),以Z表示所有終點(diǎn)結(jié)的集合,則一個(gè)博弈的展開(kāi)式可以表示為:
而一個(gè)博弈的標(biāo)準(zhǔn)式可以表示為:第3節(jié)博弈的標(biāo)準(zhǔn)式(策略式)表示以z表示某一個(gè)終點(diǎn)結(jié),以Z表示所有終點(diǎn)結(jié)的集第二章完全信息靜態(tài)博弈第二章本章導(dǎo)引第1節(jié)從占優(yōu)到納什均衡從占優(yōu)關(guān)系出發(fā),定義納什均衡第3節(jié)納什均衡定義2與存在性定理第4節(jié)應(yīng)用舉例利用最優(yōu)反應(yīng)理解并求解納什均衡第2節(jié)混合策略與混合策略納什均衡引入隨機(jī)選擇本章導(dǎo)引第1節(jié)從占優(yōu)到納什均衡從占優(yōu)關(guān)系出發(fā),定義第2節(jié)混合策略與混合策略納什均衡第1節(jié)從占優(yōu)到納什均衡第2節(jié)混合策略與混合策略納什均衡第1節(jié)第1節(jié)從占優(yōu)到納什均衡一、囚徒難題
囚徒難題的啟示:1.個(gè)體理性與集體理性存在沖突;2.“搭便車(chē)”(freerider)的行為的危害;3.“損人利己”并不是一個(gè)好的策略。嫌疑人2嫌疑人1抗拒(D)坦白(C)抗拒(D)-1,-1-9,0坦白(C)0,-9-6,-6第1節(jié)從占優(yōu)到納什均衡一、囚徒難題囚徒難為什么要加入WTO?B國(guó)A國(guó)開(kāi)放(D)限制(C)開(kāi)放(D)14,146,15限制(C)15,611,11第1節(jié)從占優(yōu)到納什均衡為什么要加入WTO?B國(guó)開(kāi)放(D)限制(C)開(kāi)放(D)14,第1節(jié)從占優(yōu)到納什均衡
如果參與人i的一個(gè)策略si是一個(gè)嚴(yán)格劣策略(strictlydominatedstrategy),那么必然存在策略s'i使得以下關(guān)系成立:
此時(shí),我們可以說(shuō)s'i嚴(yán)格占優(yōu)si
。二、嚴(yán)格占優(yōu)關(guān)系(Dominance)第1節(jié)從占優(yōu)到納什均衡如果參與人i的一個(gè)
如果參與人i的一個(gè)策略si是一個(gè)嚴(yán)格占優(yōu)策略(strictlydominantstrategy),那么必然有以下關(guān)系成立:第1節(jié)從占優(yōu)到納什均衡二、嚴(yán)格占優(yōu)關(guān)系(Dominance)
如果一個(gè)策略嚴(yán)格占優(yōu)每一個(gè)s'i≠siSi,那么si是一個(gè)嚴(yán)格占優(yōu)策略。如果參與人i的一個(gè)策略si是一個(gè)嚴(yán)格占優(yōu)第1節(jié)從占優(yōu)到納什均衡三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略參與人2左中右參與人1上1,01,20,1下0,30,12,0第1節(jié)從占優(yōu)到納什均衡三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略參與人2左中嫌疑人2嫌疑人1抗拒(N)坦白(C)抗拒(N)1,-1-9,0坦白(C)0,-9-6,-6第1節(jié)從占優(yōu)到納什均衡小豬大豬取食(P)等待(W)取食(P)5,14,4等待(W)9,-10,0三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略嫌疑人2抗拒(N)坦白(C)抗拒(N)1,-1-9,0坦第1節(jié)從占優(yōu)到納什均衡參與人2LCR參與人1T1,01,33,0M0,20,13,0B0,22,45,3三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略第1節(jié)從占優(yōu)到納什均衡參與人2LCR參與人T1,01,第1節(jié)從占優(yōu)到納什均衡三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略缺陷:
1.需要假定“所有人都是理性的”是共同知識(shí);
2.對(duì)于某些問(wèn)題的討論并無(wú)助益。其實(shí)這也是博弈專家們提出納什均衡概念的原因。第1節(jié)從占優(yōu)到納什均衡三、重復(fù)剔除嚴(yán)格劣戰(zhàn)略缺陷:四、弱占優(yōu)關(guān)系
如果參與人i的一個(gè)策略si是一個(gè)弱劣策略(weakly
dominatedstrategy),那么必然有s'i使得以下關(guān)系成立:
并且保證存在s-i使得嚴(yán)格不等式關(guān)系成立。
這種情況下我們稱s'i弱占優(yōu)si。
如果參與人i的一個(gè)策略si是弱優(yōu)策略(weaklydominantstrategy),那么弱占優(yōu)每一個(gè)s'iSi。第1節(jié)從占優(yōu)到納什均衡四、弱占優(yōu)關(guān)系如果參與人i的一個(gè)策略si是一參與人2LR參與人1U5,14,0M6,03,1D6,44,4參與人2LR參與人1U5,14,0M6,23,1D6,44,4第1節(jié)從占優(yōu)到納什均衡四、弱占優(yōu)關(guān)系參與人2LR參與人1U5,14,0M6,03,1D6第1節(jié)從占優(yōu)到納什均衡參與人2LCR參與人1T4,123,102,12M0,122,111,11B3,121,82,13BRMC四、弱占優(yōu)關(guān)系第1節(jié)從占優(yōu)到納什均衡參與人2LCR參與人T4,123參與人2LCR參與人1T4,123,102,12M0,122,111,11B3,121,82,13第1節(jié)從占優(yōu)到納什均衡CML四、弱占優(yōu)關(guān)系參與人2LCR參與人T4,123,102,12M0,第1節(jié)從占優(yōu)到納什均衡五、最優(yōu)反應(yīng)(BestResponse)
如果參與人i的一個(gè)策略si是一個(gè)s-i的一個(gè)最優(yōu)反應(yīng),那么對(duì)于所有的s'iSi,必然有以下關(guān)系成立:
定義bi:S-i→Si為參與人i的最優(yōu)反應(yīng)映射,則bi滿足:第1節(jié)從占優(yōu)到納什均衡五、最優(yōu)反應(yīng)(BestRespo參與人2b1b2b3參與人1a10,72,57,0a25,23,35,2a37,02,50,7第1節(jié)從占優(yōu)到納什均衡五、最優(yōu)反應(yīng)(BestResponse)參與人2b1b2b3參與人a10,72,57,0a25第1節(jié)從占優(yōu)到納什均衡六、納什均衡(NashEquilibrium)
納什均衡定義1:如果策略組合s*=(s*1,···,s*n)是一個(gè)納什均衡,那么必然有以下關(guān)系成立:
問(wèn)題:如果存在s'i,使得ui(s'i,s*-i)=ui(s*i,s*-i)成立,那么s'i是一個(gè)納什均衡策略么?第1節(jié)從占優(yōu)到納什均衡六、納什均衡(NashEquil第1節(jié)從占優(yōu)到納什均衡參與人2lmr參與人1L2,23,10,2M1,32,23,2R2,02,32,2六、納什均衡(NashEquilibrium)第1節(jié)從占優(yōu)到納什均衡參與人2lmr參與人L2,23,第1節(jié)從占優(yōu)到納什均衡納什均衡體現(xiàn)了以下幾個(gè)方面的含義:參與人各自獨(dú)立地追求自身利益;單獨(dú)偏離沒(méi)有意義;納什均衡是所有參與人共同的信念;納什均衡具有“自實(shí)施”(self-enforcing)的性質(zhì)。六、納什均衡(NashEquilibrium)第1節(jié)從占優(yōu)到納什均衡納什均衡體現(xiàn)了以下幾個(gè)方面的含義:參與人2lmr參與人1L5,30,43,5M4,05,54,0R3,50,45,3第1節(jié)從占優(yōu)到納什均衡六、納什均衡(NashEquilibrium)參與人2lmr參與人L5,30,43,5M4,05,第1節(jié)從占優(yōu)到納什均衡
納什均衡定義2:如果策略組合s*=(s*1,···,s*n)是一個(gè)納什均衡,那么必然有以下關(guān)系成立:
問(wèn)題:在一個(gè)用支付矩陣表示的搏弈中,用畫(huà)線法找出的一定是納什均衡么?為什么?六、納什均衡(NashEquilibrium)第1節(jié)從占優(yōu)到納什均衡納什均衡定義2:如第1節(jié)從占優(yōu)到納什均衡練習(xí)1:一群賭徒圍成一圈賭博,每個(gè)人將自己的錢(qián)放在邊上(每個(gè)人只知道自己有多少錢(qián)),突然一陣風(fēng)吹來(lái)將所有的錢(qián)混在一起,使得他們無(wú)法分辨哪些錢(qián)是屬于自己的,他們?yōu)榇税l(fā)生了爭(zhēng)執(zhí),最后請(qǐng)來(lái)一位律師。律師宣布這樣的規(guī)則,每個(gè)人將自己的錢(qián)數(shù)寫(xiě)在紙上,然后將紙條交給律師,如果所有人要求的錢(qián)數(shù)加總不大于已有錢(qián)的總數(shù),每個(gè)人得到自己要求的那部分,剩余部分歸律師;如果所有人要求的錢(qián)加總大于已有錢(qián)的總數(shù),則所有的錢(qián)歸律師所有。寫(xiě)出這個(gè)博弈每個(gè)參與人的戰(zhàn)略空間與支付函數(shù),求出所有的納什均衡。(假設(shè)錢(qián)的總數(shù)為M,M為共同知識(shí))。第1節(jié)從占優(yōu)到納什均衡練習(xí)1:一群賭徒圍成一圈賭博,每個(gè)第1節(jié)從占優(yōu)到納什均衡
一般性假定:(1)兩個(gè)或多個(gè)廠商生產(chǎn)完全無(wú)差異的某種產(chǎn)品;
(2)市場(chǎng)的逆需求函數(shù)為:;
(3)企業(yè)i的成本,因此企業(yè)i的利潤(rùn)函數(shù)為:七、古諾模型第1節(jié)從占優(yōu)到納什均衡一般性假定:七、古第1節(jié)從占優(yōu)到納什均衡對(duì)于任一家企業(yè)而言,利潤(rùn)最大化意味著如下的最優(yōu)化問(wèn)題:
企業(yè)i利潤(rùn)最大化的一階條件為:七、古諾模型第1節(jié)從占優(yōu)到納什均衡對(duì)于任一家企業(yè)而言第1節(jié)從占優(yōu)到納什均衡七、古諾模型第1節(jié)從占優(yōu)到納什均衡七、古諾模型第1節(jié)從占優(yōu)到納什均衡
假定:
(1)兩個(gè)廠商生產(chǎn)無(wú)差異的產(chǎn)品,企業(yè)的成本函數(shù)也完全相同;
(2)市場(chǎng)需求函數(shù)為:
(3)假定市場(chǎng)競(jìng)爭(zhēng)的形勢(shì)極為激烈,如果一家廠商的價(jià)格高于另外一家,則失卻全部市場(chǎng);反之亦然;
(4)假定每個(gè)廠商的邊際成本都是c,且無(wú)固定成本,兩個(gè)廠商都只在價(jià)格不小于邊際成本時(shí)才進(jìn)行生產(chǎn);如果價(jià)格相同,則平分市場(chǎng)份額。八、伯川德(Bertrand)模型第1節(jié)從占優(yōu)到納什均衡假定:八、伯川德(第1節(jié)從占優(yōu)到納什均衡
伯川德悖論:如果兩個(gè)廠商經(jīng)營(yíng)同樣的產(chǎn)品,且成本相同,則二者之間的價(jià)格競(jìng)爭(zhēng)必然使每家企業(yè)都按照邊際成本定價(jià),因而只能獲取正常利潤(rùn);從長(zhǎng)期來(lái)看,低成本的企業(yè)將驅(qū)逐高成本的企業(yè)。伯川德悖論不能廣泛存在的原因:
(1)埃奇沃思(Edgeworth):由于企業(yè)的生產(chǎn)能力有限,所以高成本的企業(yè)也可以得到一部分市場(chǎng)份額;
(2)博弈時(shí)序;
(3)產(chǎn)品差異:現(xiàn)實(shí)中的產(chǎn)品不是完全相互替代的。八、伯川德(Bertrand)模型第1節(jié)從占優(yōu)到納什均衡伯川德悖論:如果兩
有產(chǎn)品差異的伯川德模型:
(1)兩家企業(yè)生產(chǎn)有差異可互相替代的同類(lèi)產(chǎn)品。假定消費(fèi)者對(duì)每家企業(yè)的需求函數(shù)為:
(2)兩家企業(yè)的生產(chǎn)均為固定成本,且邊際成本均為c。八、伯川德(Bertrand)模型有產(chǎn)品差異的伯川德模型:八、伯川德(Bert第1節(jié)從占優(yōu)到納什均衡
假定:兩個(gè)商店產(chǎn)品無(wú)差異,但是由于地理分布不同對(duì)消費(fèi)者而言成本不同。
(1)城市為線性,消費(fèi)者均勻分布,密度為1,消費(fèi)者具有單位需求;
(2)兩家商店分別坐落在城市的兩端,提供單位商品的成本為c;
(3)消費(fèi)者的移動(dòng)需要花費(fèi)成本,單位成本為t;
(4)假定消費(fèi)者從消費(fèi)商品中所獲得效用為S,且S足夠大,使得每個(gè)消費(fèi)者都需要1單位商品,但是也僅僅需要1單位商品。九、霍特林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型(v1)第1節(jié)從占優(yōu)到納什均衡假定:兩個(gè)商店產(chǎn)品第1節(jié)從占優(yōu)到納什均衡
假定:兩個(gè)商店產(chǎn)品無(wú)差異,但是由于地理分布不同對(duì)消費(fèi)者而言成本不同。
(1)城市為線性,消費(fèi)者均勻分布,密度為1,消費(fèi)者具有單位需求;
(2)兩家商店的位置分別是a和1-b,不失一般性地,我們假定1-a-b>0,提供單位商品的成本為c;
(3)消費(fèi)者的移動(dòng)需要花費(fèi)成本,單位成本為td2;
(4)假定消費(fèi)者從消費(fèi)商品中所獲得效用為S,且S足夠大,使得每個(gè)消費(fèi)者都需要1單位商品。九、霍特林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型(v2)第1節(jié)從占優(yōu)到納什均衡假定:兩個(gè)商店產(chǎn)品第1節(jié)從占優(yōu)到納什均衡九、霍特林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型(v2)第1節(jié)從占優(yōu)到納什均衡九、霍特林(Hotelling)價(jià)第1節(jié)從占優(yōu)到納什均衡
練習(xí):如果在一條一千米長(zhǎng)的長(zhǎng)街上均勻居住著許多居民,有兩個(gè)人同時(shí)想在該長(zhǎng)街開(kāi)便利店。
(1)如果假設(shè)所有居民都是到最近的便利店購(gòu)買(mǎi)商品,間這兩個(gè)人會(huì)如何選擇店面位置?(2)如果每戶居民仍然到離得最近的便利店購(gòu)買(mǎi),但購(gòu)買(mǎi)數(shù)量與他們到便利店的距離有關(guān),如Q=1-D,其中Q是購(gòu)買(mǎi)量,D是居民與便利店的距離,此時(shí)兩個(gè)人會(huì)怎樣選擇店面的位置?九、霍特林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型:其他第1節(jié)從占優(yōu)到納什均衡練習(xí):如果在一條一第1節(jié)從占優(yōu)到納什均衡
練習(xí):設(shè)某個(gè)地方的居民均勻地環(huán)繞一個(gè)圓形湖居住。兩個(gè)小販來(lái)此地推銷(xiāo)商品。
(1)如果居民都選擇離自己較近的小販購(gòu)買(mǎi)商品,問(wèn)小販選擇推銷(xiāo)地點(diǎn)博弈的納什均衡是什么?(2)如果有三個(gè)小販同時(shí)到此地推銷(xiāo)商品,那么推銷(xiāo)地點(diǎn)博弈的納什均衡又是什么?(3)如果圓形湖的周長(zhǎng)是1(千米),而居民的購(gòu)買(mǎi)量是它們與小販距離的函數(shù)Q=1-D,其中Q是購(gòu)買(mǎi)量,D是居民與小販推銷(xiāo)點(diǎn)距離,則兩個(gè)和三個(gè)小販博弈的納什均衡各是什么?九、霍特林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型(v2)第1節(jié)從占優(yōu)到納什均衡練習(xí):設(shè)某個(gè)地方的
一片草原上生活著一群聰明的牧人,他們各自勤奮工作,增加著自己的牛羊。畜群不斷擴(kuò)大,終于達(dá)到了這片草原可以承受的極限,每再增加一頭牛羊,都會(huì)給草原帶來(lái)?yè)p害。但每個(gè)牧人的聰明都足以使他明白,如果他們?cè)黾右活^牛羊,由此帶來(lái)的收益全部歸他自己,而由此造成的損失則由全體牧人分擔(dān)。于是,牧人們不懈努力,繼續(xù)繁殖各自的畜群。最終,這片草原毀滅了。——加勒特·哈丁
(Garrett
Hardin),1968十、公地悲劇第1節(jié)從占優(yōu)到納什均衡一片草原上生活著一群聰明的牧人,他們各自勤奮1.一項(xiàng)可再生自然資源由n個(gè)人共同所有,nN;2.每個(gè)擁有者都可以利用這種資源生產(chǎn)某種產(chǎn)品,不妨設(shè)其中第i個(gè)人生產(chǎn)的數(shù)量為qi(0,∞),而市場(chǎng)上這種產(chǎn)品的總供給量則為Q=∑qi;3.市場(chǎng)上該種產(chǎn)品的價(jià)格P是總供給量的函數(shù),即P=P(Q),不失一般性地,我們假定:4.該產(chǎn)品的生產(chǎn)中以邊際成本不變的方式進(jìn)行,且不耗費(fèi)固定成本,因此可以設(shè)每增加一單位產(chǎn)品增加的成本為c;十、公地悲劇第1節(jié)從占優(yōu)到納什均衡1.一項(xiàng)可再生自然資源由n個(gè)人共同所有,n1.假定這個(gè)社會(huì)有n個(gè)居民,每個(gè)居民自愿供給的公共品數(shù)量為為gi(0,∞),則G=∑gi;3.令px和pG分別為私人物品和公共品的價(jià)格,Mi為第i個(gè)居民的預(yù)算約束。2.居民i的效用函數(shù)為:其中?ui/?xi>0,?ui/?G
>0。且私人物品和公共物品之間的邊際替代率是遞減的。十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡1.假定這個(gè)社會(huì)有n個(gè)居民,每個(gè)居民自愿供給
對(duì)于每個(gè)社會(huì)成員而言,需要求解如下最大化問(wèn)題:
利用拉格朗日乘數(shù)法,構(gòu)造如下函數(shù):
繼而求得:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡對(duì)于每個(gè)社會(huì)成員而言,需要求解如下最大化問(wèn)題
假定全體居民的社會(huì)福利函數(shù)為:
則對(duì)這個(gè)社會(huì)而言,其全體成員整體的最優(yōu)化問(wèn)題是:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡假定全體居民的社會(huì)福利函數(shù)為:
利用拉格朗日乘數(shù)法,構(gòu)造如下函數(shù):
繼而求得:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡利用拉格朗日乘數(shù)法,構(gòu)造如下函數(shù):(2)式即存在公共品情況下帕累托最優(yōu)的薩繆爾遜條件(Samuelson,1954)。
改寫(xiě)上述帕累托條件:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡(2)式即存在公共品情況下帕累托最優(yōu)的薩繆爾
更進(jìn)一步地,我們假定消費(fèi)者的效用函數(shù)采用柯布-道格拉斯形式:其中:這種情況下,結(jié)合個(gè)人最優(yōu)的均衡條件與預(yù)算約束可得:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡更進(jìn)一步地,我們假定消費(fèi)者的效用函數(shù)采用柯布
如果所有居民有相同的收入水平,那么:
納什均衡下公共品的總供給量為:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡如果所有居民有相同的收入水平,那么:
如果所有居民有相同的收入水平,帕累托最優(yōu)的一階條件為:
代入預(yù)算約束可得單個(gè)居民的帕累托最優(yōu)貢獻(xiàn)為:
則公共品的總供給量為:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡如果所有居民有相同的收入水平,帕累托最優(yōu)的一
納什均衡的公共品總供給與帕累托最優(yōu)的公共品總供給比率為:十一、公共品的私人供給問(wèn)題第1節(jié)從占優(yōu)到納什均衡納什均衡的公共品總供給與帕累托最優(yōu)的公共品總第2節(jié)混合策略與混合策略納什均衡第2節(jié)混合策略與混合策略納什均衡第2節(jié)混合策略與混合策略納什均衡第2節(jié)第2節(jié)混合策略與混合策略納什均衡猜硬幣的搏弈參與人2參與人1HTH-1,11,-1T1,-1-1,1第2節(jié)混合策略與混合策略納什均衡猜硬幣的搏弈參與人2HT流浪者政府工作游蕩救濟(jì)3,2-1,3不作為-1,10,0第2節(jié)混合策略與混合策略納什均衡政府與流浪者的搏弈流浪者工作游蕩救濟(jì)3,2-1,3不作為-1,10,0第2節(jié)混合策略與混合策略納什均衡膽小鬼搏弈(chickengame)參與人2參與人1強(qiáng)硬軟弱強(qiáng)硬-10,-105,-5軟弱-5,5-5,-5第2節(jié)混合策略與混合策略納什均衡膽小鬼搏弈(chicke一、混合策略(MixStrategy)第2節(jié)混合策略與混合策略納什均衡
在博弈G={N,{Si},{ui}}中,假定第i個(gè)人有K個(gè)策略Si={si1,si2,
···,siK}
如果函數(shù)σi(sik)滿足如下條件,則稱σi為i的一個(gè)混合策略:
(1)(2)一、混合策略(MixStrategy)第2節(jié)混合策略與一、混合策略(MixStrategy)第2節(jié)混合策略與混合策略納什均衡參與人2LR參與人1U3,-0,-M0,-3,-D1,-1,-參與人2LR參與人1U3,-0,-M0,-3,-D2,-2,-一、混合策略(MixStrategy)第2節(jié)混合策略與二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡參與人2參與人1H(q)T(1-q)H(r)-1,11,-1T(1-r)1,-1-1,1
如果參與人2混合策略為(q,1-q),則:二、混合策略納什均衡(MixStrategyNE)第2節(jié)二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡二、混合策略納什均衡(MixStrategyNE)第2節(jié)二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡Orq1/211二、混合策略納什均衡(MixStrategyNE)第2節(jié)二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡假定參與者1和2的純策略空間分別為:S1={s11,…,s1J}S2={s21,…,s2K}
如果參與人2選取的混合策略為:σ2=(p21,…,p2k)二、混合策略納什均衡(MixStrategyNE)第2節(jié)二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡參與人1選擇純戰(zhàn)略s1所得的期望支付為:參與人1選擇混合策略σ1=(p11,…,p2k)所的期望支付為:二、混合策略納什均衡(MixStrategyNE)第2節(jié)二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡參與人2選擇混合策略σ2=(p11,…,p2k)所的期望支付為:二、混合策略納什均衡(MixStrategyNE)第2節(jié)
混合納什均衡定義1:如果策略組合σ*=(σ*1,···,σ*n)是一個(gè)納什均衡,那么必然有以下關(guān)系成立:二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡混合納什均衡定義1:如果策略組合σ*=(σ*二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡
在混合策略σ=(σ1,···,σn)中,設(shè)S+iSi是參與人以正概率選擇的純策略的集合。如果σ是一個(gè)納什均衡,那么對(duì)于i=0,…,n必然有:二、混合策略納什均衡(MixStrategyNE)第2節(jié)第2節(jié)混合策略與混合策略納什均衡猜硬幣的搏弈參與人2參與人1HTH-1,11,-1T1,-1-1,1二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡猜硬幣的搏弈參與人2HTOp2p11/211二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡Op2p11/211二、混合策略納什均衡(MixStrat流浪者政府工作游蕩救濟(jì)3,2-1,3不作為-1,10,0第2節(jié)混合策略與混合策略納什均衡政府與流浪者的搏弈二、混合策略納什均衡(MixStrategyNE)流浪者工作游蕩救濟(jì)3,2-1,3不作為-1,10,0第2節(jié)混合策略與混合策略納什均衡性別戰(zhàn)JaneChrisOperaBoxingOpera2,10,0Boxing0,01,2二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡性別戰(zhàn)JaneOpera嫌疑人2嫌疑人1抗拒(D)坦白(C)抗拒(D)-1,-1-9,0坦白(C)0,-9-6,-6Player2LMRPlayer1U0,03,46,0M4,30,00,0D0,60,05,5二、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡嫌疑人2抗拒(D)坦白(C)抗拒(D)-1,-1-9,0
納什均衡存在性定理I:每一個(gè)有限博弈至少存在一個(gè)納什均衡(可能是混合策略的)。
納什均衡存在性定理II:n人搏弈中,如果Si是歐式空間中的一個(gè)非空、閉的、有界的凸集,ui(s)連續(xù),且對(duì)si是擬凹的,那么存在納什均衡。
納什均衡存在性定理III:n人搏弈中,如果Si是歐式空間中的一個(gè)非空、閉的、有界的凸集,ui(s)連續(xù),那么存在混合策略納什均衡。三、混合策略納什均衡(MixStrategyNE)第2節(jié)混合策略與混合策略納什均衡納什均衡存在性定理I:每一個(gè)有限博弈至少存在參與人2參與人1強(qiáng)硬軟弱強(qiáng)硬-10,-105,-5軟弱-5,5-5,-52.考慮一個(gè)工作申請(qǐng)的博弈。兩個(gè)學(xué)生同時(shí)向兩家企業(yè)申請(qǐng)工作,每家企業(yè)只有一個(gè)工作崗位。工作申請(qǐng)規(guī)則如下:每個(gè)學(xué)生只能向其中一家企業(yè)申請(qǐng)工作;如果一家企業(yè)只有一個(gè)學(xué)生申請(qǐng),該學(xué)生獲得工作;如果一家企業(yè)有兩個(gè)學(xué)生申請(qǐng),則每個(gè)學(xué)生獲得工作的概率為1/2。現(xiàn)在假定每家企業(yè)的工資滿足:
。試問(wèn):
(1)寫(xiě)出以上博弈的戰(zhàn)略式描述(2)求出以上博弈的所有納什均衡第2節(jié)混合策略與混合策略納什均衡:習(xí)題參與人2強(qiáng)硬軟弱強(qiáng)硬-10,-105,-5軟弱-5,5CharlieLucyHTH-1,12,-2T2,-2-3,33.猜拳游戲是一種非常常見(jiàn)的零和博弈,那么(1)寫(xiě)出這個(gè)博弈的戰(zhàn)略式描述;(2)求出以該博弈的所有納什均衡
4.Lucy提議與Charlie進(jìn)行這樣一個(gè)博弈:兩人同時(shí)拿出一枚硬幣,如果朝上的一面都是H,那么Lucy給Charlie1美元;如果朝上的一面都是T,那么Lucy給Charlie3美元;如果朝上的一面不同,那么Charlie給Lucy2美元。如果你是查理,你會(huì)同Lucy玩這樣的游戲么?第2節(jié)混合策略與混合策略納什均衡:習(xí)題CharlieHTH-1,12,-2T2,-2-3,
(投票博弈)假定有三個(gè)參與人(1、2和3)要在三個(gè)項(xiàng)目(A、B和C)中選中一個(gè)。三人同時(shí)投票,不允許棄權(quán),因此,每個(gè)參與人的戰(zhàn)略空間Si={A,B,C}。得票最多的項(xiàng)目被選中,如果沒(méi)有任何項(xiàng)目得到多數(shù)票,項(xiàng)目A被選中。參與人的支付函數(shù)如下:U1(A)=U2(B)=U3(C)=2U1(B)=U2(C)=U3(A)=1U1(C)=U2(A)=U3(B)=0
求解以上博弈的所有純戰(zhàn)略納什均衡。補(bǔ)充:三人博弈(投票博弈)假定有三個(gè)參與人(1、2和3)要12和3ABCABCABCABCA2,0,12,0,12,0,12,0,11,2,02,0,12,0,12,0,10,1,2B2,0,11,2,02,0,11,2,01,2,01,2,02,0,11,2,00,1,2C2,0,12,0,10,1,22,0,11,2,00,1,20,1,20,1,20,1,2補(bǔ)充:三人博弈12和3ABCABCABCABCA2,0,12,0,12,012和3X3Y3X2Y2X2Y2X10,0,06,5,44,6,50,0,0Y15,4,60,0,00,0,00,0,0補(bǔ)充:三人博弈12和3X3Y3X2Y2X2Y2X10,0,06,5,44,第三章完全信息動(dòng)態(tài)博弈第三章本章導(dǎo)引第1節(jié)完美信息動(dòng)態(tài)博弈第2節(jié)完全但不完美信息動(dòng)態(tài)博弈本章導(dǎo)引第1節(jié)完美信息動(dòng)態(tài)博弈第2節(jié)完全但不完第1節(jié)完美信息動(dòng)態(tài)博弈第1節(jié)一、完美信息動(dòng)態(tài)博弈與可信性EI02-3-121inoutFA企業(yè)IF,ifinA,ifin企業(yè)Eout0,20,2in-3,-12,1一、完美信息動(dòng)態(tài)博弈與可信性EI0-32inoutFA企業(yè)I二、逆向歸納法(BackwardInduction)
因?yàn)椴┺氖怯邢薜模┺臉?shù)上一定存在一個(gè)最后的決策結(jié)的集合。(即倒數(shù)第二個(gè)結(jié),它的直接后續(xù)結(jié)是終點(diǎn)結(jié)),在該決策結(jié)上行動(dòng)的參與人將選擇一個(gè)最大化自己的支付的行動(dòng);給定這個(gè)參與人的選擇,倒數(shù)第二個(gè)決策結(jié)上的參與人將選擇一個(gè)可行的行動(dòng)最大化自己的支付……如此等等,直到初始結(jié)。當(dāng)這個(gè)倒推過(guò)程完成時(shí),我們得到一個(gè)路徑,該路徑為每一個(gè)參與人給出一個(gè)特定的戰(zhàn)略,所有這些戰(zhàn)略構(gòu)成一個(gè)納什均衡。二、逆向歸納法(BackwardInduction)EI02-3-121inoutFA21二、逆向歸納法(BackwardInduction)EI0-32inoutFA2二、逆向歸納法(Backward201-1563125450-17-220Player1LRPlayer2Player3lrlrlrabPlayer3二、逆向歸納法(BackwardInduction)2-1350-2Player1LRPlayer2Play201-1563125450-17-260Player1LRPlayer2Player3lrlrlrabPlayer3二、逆向歸納法(BackwardInduction)2-1350-2Player1LRPlayer2Play
施佩澤拉(Spizella)是一家生產(chǎn)工作站專用計(jì)算機(jī)處理芯片的公司。其工廠芯片的年產(chǎn)量為300萬(wàn)個(gè),總成本為10億美元,即單件成本為333.333美元。施佩澤拉公司的的管理者了解到旅行者(Passesser)公司正考慮建造工廠生產(chǎn)同類(lèi)芯片。在目前情況下,施佩澤拉公司每年可以以700美元的單價(jià)銷(xiāo)售300萬(wàn)個(gè)芯片,獲利11億美元。但是,如果第二家工廠進(jìn)入市場(chǎng),芯片總產(chǎn)出將為600萬(wàn)個(gè),單價(jià)則降為400美元。每家工廠的年銷(xiāo)售額為12億美元,利潤(rùn)僅為2億美元。更糟糕的是,如果有兩家新工廠同時(shí)進(jìn)入市場(chǎng),總產(chǎn)出將為900萬(wàn)個(gè),單價(jià)降為200美元,每家工廠每年就會(huì)虧損4億美元。產(chǎn)量(百萬(wàn))價(jià)格370064009200二、逆向歸納法(BackwardInduction)施佩澤拉(Spizella)是一家生產(chǎn)工作站
有5個(gè)海盜搶得枚金幣,在如何分贓問(wèn)題上爭(zhēng)吵不休。于是他們決定:
(1)抽簽決定各人的號(hào)碼[1,2,3,4,5](2)由1號(hào)提出分配方案,然后5人表決,如果方案超過(guò)半數(shù)同意就被通過(guò),否則他將被扔進(jìn)大海喂鯊魚(yú)。
(3)1號(hào)死后,由2號(hào)提方案,4人表決,當(dāng)且僅當(dāng)超過(guò)半數(shù)同意時(shí)方案通過(guò),否則2號(hào)同樣被扔進(jìn)大海
(4)依次類(lèi)推,直到找到一個(gè)每個(gè)人都接受的方案。如果只剩下5號(hào),他當(dāng)然接受一人獨(dú)吞所有的金幣。此外,假定每個(gè)強(qiáng)盜都是能很理智地判斷得失的“理性人”。且每個(gè)判決都能順利執(zhí)行。二、逆向歸納法(BackwardInduction)有5個(gè)海盜搶得枚金幣,在如何分贓問(wèn)題上爭(zhēng)吵不
有兩個(gè)參與者Anna(簡(jiǎn)稱A)和Bob(簡(jiǎn)稱B),要分一個(gè)壇子里裝的一筆錢(qián)。在第1階段,A可以選擇從壇子中抓錢(qián),也可以選擇不抓而把壇子傳給B。如果選擇“抓”,B就只能得到較少的錢(qián)。如果A在第1階段選擇“傳”,壇子中的錢(qián)的總額會(huì)增加。接下來(lái),如果B選擇“抓”,A就只能得到較少的收益。然而,如果B在第2階段選擇“傳”,壇子中的錢(qián)將進(jìn)一步增加,然后他們平分收益。412655抓傳傳抓AB三、蜈蚣博弈有兩個(gè)參與者Anna(簡(jiǎn)稱A)和Bob(簡(jiǎn)稱
要脅訴訟是指這樣一類(lèi)指控,這法庭外私了從被告那里得到補(bǔ)償。既然成功的希望很小且指控并不是沒(méi)有成本的,原告為什么要指控呢?因?yàn)樗辣桓孓q護(hù)的成本很大,所以可能同意私了。其中,我們假設(shè)P0,0指控不指控D接受s-c,-s拒絕放棄P起訴-c,0三、蜈蚣博弈要脅訴訟是指這樣一類(lèi)指控,這法庭外私了從被告
這個(gè)博弈有兩個(gè)參與人:原告P(rosecutor)和被告D(efendant)。行動(dòng)順序如下:
(1)原告決定是否對(duì)被告提出指控,指控的成本為c>0;
(2)如果決定指控,原告要求被告支付s>0以了卻訴訟;
(3)被告決定接受還是拒絕原告的要求;
(4)如果被告拒絕,原告決定是放棄指控還是向法庭起訴,原告的起訴成本(包括律師費(fèi)用)為p,被告的辯護(hù)成本為d;
(5)如果案子要室法庭,原告以θ的概率贏得x單位的支付。三、蜈蚣博弈這個(gè)博弈有兩個(gè)參與人:原告P(rosecutP0,0指控不指控D接受s-c-p,-s拒絕放棄P起訴-c-p,0如果原告提前支付訴訟費(fèi)用:思考:如果被告在受到威脅之后馬上支付訴訟費(fèi)用呢?三、蜈蚣博弈P0,0指控不指控D接受s-c-p,-s拒絕放棄P起訴-游戲1:游戲1:游戲2:兩個(gè)參與人,A和B,輪流選擇一個(gè)介于2和10之間的整數(shù)(可重復(fù))。當(dāng)累計(jì)總和達(dá)到100的時(shí)候,博弈結(jié)束。此時(shí)判所選數(shù)字恰好使累計(jì)總和達(dá)到或超過(guò)100的參與人為敗者。試問(wèn)誰(shuí)能贏得這場(chǎng)博弈?最優(yōu)策略又是什么?如果數(shù)字累計(jì)總和達(dá)到100的參與人為贏家又如何?游戲2:兩個(gè)參與人,A和B,輪流選擇一個(gè)介于四、斯坦克爾伯格(Stackelberg)寡頭競(jìng)爭(zhēng)模型假定條件:在斯坦克爾伯格模型中,企業(yè)的行動(dòng)也是選擇產(chǎn)量。在斯坦克爾伯格模型中,企業(yè)1(稱為領(lǐng)頭企業(yè),leader)首先選擇產(chǎn)量q1≥0,企業(yè)2(稱為尾隨企業(yè),follower)觀測(cè)到q1,然后選擇自已的產(chǎn)量q2≥0。假定逆需求函敬為P(Q)=a-q1-q2,,兩個(gè)企業(yè)有相同的不變單位成本c≥0。四、斯坦克爾伯格(Stackelberg)寡頭競(jìng)爭(zhēng)模型假定條五、關(guān)系專用性資產(chǎn)投資
一個(gè)電力企業(yè)集團(tuán)有兩個(gè)子公司,分別是一家電力設(shè)備企業(yè)和一家發(fā)電廠。在集團(tuán)內(nèi)部,電力設(shè)備企業(yè)向發(fā)電廠提供一種帶有關(guān)系專用性資產(chǎn)性質(zhì)的設(shè)備。現(xiàn)在出現(xiàn)了一種技術(shù),可以降低該種設(shè)備的成本。電力設(shè)備企業(yè)有權(quán)決定是否進(jìn)行這種投資,而發(fā)電廠不能直接影響是否投資以及投資多少的決策。
假設(shè)在該技術(shù)上的投資x與該設(shè)備的成本c之間具有如下關(guān)系:c=c(x),且dc/dx<0,d2c/dx2>0。此外,這種設(shè)備對(duì)于發(fā)電廠的價(jià)值為v,且v是共同知識(shí)。v與x無(wú)關(guān),但是v>c(0)。假設(shè)這種設(shè)備的交易方式有三種:(1)雙方平分交易剩余;(2)給與電力設(shè)備企業(yè)定價(jià)權(quán);(3)給與發(fā)電廠定價(jià)權(quán)。如果你是集團(tuán)的領(lǐng)導(dǎo)者,最求集團(tuán)整體利益的最大化,你會(huì)選擇哪種交易方式?五、關(guān)系專用性資產(chǎn)投資一個(gè)電力企業(yè)集團(tuán)有兩個(gè)關(guān)系專用性資產(chǎn)(relationshipspecificassets)是指有些資產(chǎn)(可能是無(wú)形資產(chǎn))是相互依賴的,如果雙方的關(guān)系不存在了,他們的價(jià)值也就可能不存在了。
關(guān)系專用性資產(chǎn)一旦改作他用,其價(jià)值就會(huì)降低,因此,投入公司的這部分資產(chǎn)是處于風(fēng)險(xiǎn)狀態(tài)的。為激勵(lì)專用性資產(chǎn)進(jìn)入公司,需要給予其投入者一定的監(jiān)控權(quán),以保障其自身的利益。并不是只有股東投入的股本才是專用性資產(chǎn),債權(quán)人、雇員甚至是消費(fèi)者和供應(yīng)商投入的資產(chǎn)都可能是關(guān)系專用性的。由于這些利益相關(guān)者對(duì)公司的績(jī)效都做出了貢獻(xiàn),那么公司理所當(dāng)然要為利益相關(guān)者服務(wù),一部分利益相關(guān)者通過(guò)直接介入公司的決策機(jī)構(gòu),參與公司的戰(zhàn)略制定,以此來(lái)保障自身的利益,股東僅僅是其中之一。利益相關(guān)者理
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)業(yè)科技與農(nóng)村文化創(chuàng)新基地人才培養(yǎng)模式創(chuàng)新考核試卷
- 溝通中的情感智力發(fā)展策略考核試卷
- 游藝設(shè)備適老化設(shè)計(jì)考核試卷
- 中醫(yī)艾灸試題及答案
- 單招考試面試題材及答案
- 寵物驅(qū)蟲(chóng)試題及答案
- 電焊入場(chǎng)考試題及答案
- 泡面餐廳測(cè)試題及答案
- javajvm原理面試題及答案
- 社工職業(yè)考試試題及答案
- 2025盤(pán)錦市雙臺(tái)子區(qū)輔警考試試卷真題
- DB13T 2770-2018 焊接熔深檢測(cè)方法
- 關(guān)于衛(wèi)生院“十五五”發(fā)展規(guī)劃(完整本)
- 夫妻存款贈(zèng)與協(xié)議書(shū)
- 2025海南中考:歷史必考知識(shí)點(diǎn)
- 2024年常州工學(xué)院輔導(dǎo)員考試真題
- 公司財(cái)務(wù)內(nèi)控培訓(xùn)
- 付款合同協(xié)議書(shū)范本
- 陪玩團(tuán)轉(zhuǎn)讓合同協(xié)議
- SL631水利水電工程單元工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)第2部分:混凝土工程
- 2024-2025學(xué)年蘇教版七年級(jí)生物下冊(cè)知識(shí)點(diǎn)復(fù)習(xí)提綱
評(píng)論
0/150
提交評(píng)論