




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章博弈與均衡1999“game1982game弈論”中所使用的“博弈”二字的含義了?,F在,我們使用詞匯“博弈”或“game”游戲在內的對抗性游戲都可用“博弈”或“game”來指稱(體力競賽一般不用“博弈”實際上,我們現在使用“博弈”一詞是在這樣一種十分廣泛的意義上加以理解的,即棋、玩牌”在內的所有智力游戲,又包括了許多其他沒有輸贏的活動或過程,包括經濟行為和軍事對抗中的計謀活動。在正規的場合,通常按如下方式給“博弈論”下一個學術性定義:博弈論就是研究理性人行為選擇的理論。這種定義出現在許多教科書中,已經成為了一種十分標準的定義。許多不同的學科都研究人的行為,如心理學、社會學,當然還有經濟學,但我們今天所說的“博弈論”通常指經濟學中的理性人行為選擇理論。盡管如此,博弈論在軍事學、生物學、系統科學等領域中也有十分廣泛性人”的行為。什么是理性人呢?按經濟學家的定義,理性人就是追求效用最大化的個人。有人對理性人概念提出這樣的批評:現實生活中的個人基于信息采集及處理的高成本和有限的計算能力,往往不可能在個人行為選擇中實現其潛在的效用最大化,實際所完成的選擇通常是次優(suboptimize)而非最優(optimize念是對現實中個人的非現實描寫。但是,如果我們將個人在信息收集處理和計算過程中的困難理解為個人付出的成本,并且假設個人在決策時將會考慮到這種成本的存在且對行為選擇的成本和效益進行權衡。那么,這種成本——效益分析的結果將決定個1人的行為選擇。因此,在這種意義上,理性人假設并不與現實中的個人行為相背離,上面那種批評是缺乏邏輯基礎的。當然,作為生物學意義上的個人是具有自由意志的人,他完全可以不按新古典經濟學家所規定的效用最大化程序去進行個人行為選擇,如果一個企業家不追求效用最大化,他的企業就可能因為他所做出的一系列不明智的決策而出現經常性的虧損,最后也會在競爭中被淘汰出局。經濟學家并不否認現實中的個人存在非理性行為或自由意志,但經濟學家只是將研究的注意力集中在個人的理性行為方面,也就是說,經濟學家只研究理性人的行為或人的理性行為,因為只有作出這種限定之后,經濟學研究才有可能獲得明確的結果和對經濟現象作出預測,而預測能力是科學理論應具有的根本功能(關于這一點,我們將在下面加以展開)。博弈論是一門十分年輕的科學,其研究的起源可以回溯到第二次世界大戰早期,當英國海軍和德國潛艇玩貓捉老鼠游戲時,需要對游戲更深刻地理解才能更多地贏得勝利。他們發現并不是依靠領航員或船長憑直覺作出的判斷而采取了正確的行動。在他們應用了后來被稱為博弈論的概念之后,英國海軍極大地提高了對德國潛艇的打擊命中率。而對德國潛艇的勝利又促使他們把博弈論應用到許多其他的戰斗中去。因此,博弈論是在生與死的環境下得到驗證之后,才在今天以系統理論的面貌出現在書本上1944NeumannandMorgenstern1944)標志著博弈論經典科學體系的計謀活動。這一輝煌的巨著,預示了20世紀最偉大的科學成就之一的到來。它引發了經濟、政治、軍事戰略、法律、計算機科學、甚至生物進化論等領域大量的科學論文。在這些領域,博弈論都能闡釋出主要的發現。但博弈論在其十分短暫的發展過程中卻有著十分曲折的經歷。在博弈論誕生伊始之時,整個社會乃至學術界都不太了解它,以至于二戰后顛沛流離于澳大利亞的博弈論大師、匈牙利人海薩尼(Harsanyi然在大學圖書館中看見博弈論學術專著被與描寫下棋玩牌等游戲類的書籍混雜擺放在一起。在這樣一種不識博弈論為何物的環境里,海薩尼本人的命運可想而知,在失業和學術價值得不到承認的雙重打擊下,他輾轉去了美國。1994Nash)和澤爾騰(Selten)分享當年的諾貝爾經濟學獎,當時的美國報刊就以“澳大利亞是博弈論的最大輸家”為題對海薩尼在澳大利亞的這段心酸事作了報道。澳大利亞因不識海薩尼所做工作的價值而失去了擁有一位諾貝爾獎得主的機會,損失當然巨大啦!2.1作為經濟模型的博弈論2.1.1游戲博弈與經濟互動的異同2zerosumgameplayerwin–win1加1大于21減1一方所得就是另一方所失,有可能雙方都因某種行為的選擇而同時有所得或同時有所方面的問題。在國際象棋比賽中,倘若兩個局中人都具有同樣的理性程度,則數學家Zermelo(Zermelo,1913)曾證明比賽的結果必為平局。但是,現實中的對弈結果并非3勢,如轉圓石于千仞之山者,勢也(黃樸民,1989搶占至高點、鼓舞士氣等。故孫子曰:是故善戰者,其勢險……故善戰者,求之于勢,不責于人,故能擇人而任勢。任勢者,其戰人也,如轉木石……(黃樸民,1989類似于下棋玩牌甚至戰爭中的計謀運用在經濟活動中也隨處可見。在商戰博弈中,商家憑計謀取勝更被視為商戰高招。孫子云:不戰而屈人之兵,善之善者也(黃樸民,1989成的巨大損失,使其最終放棄進入行業的打算。除此之外,信息不對稱也會對經濟互動產生重要的影響。lemonthemarketforlemons4量有關的信息掌握得很少,至少比賣車人掌握的有關信息少得多。無論舊車有無毛病,賣車人都會盡量夸大舊車的質量。倘若舊車確有質量問題,賣車人也會盡量隱瞞真情,是好車,另一半是存在質量問題的破車。假定好車價值20萬元,破車價值為10萬元,上僅有50%15(20+10)/2=15201510萬元,倘若可以按15萬元成交,算下來會大賺一筆。假定買車人是理性的,他也明白這個道理,于是,他會將那些積極與他按每輛15萬元成交的賣車人視為出售破車者,他因此會將市場上還在繼續出售的車中存在破車的概率向上調整(他知道在每輛15萬元價格1如果買車人不想買一輛破車回家,則買者會退出市場,整個舊車市場消失。順便提及,Akerlof,197052001首即拾。相似點本質上表現為它們都是行為主體通過理性選擇其行動或策略以達到預期效用最基礎。2.1.2科學理論與模型chaos19951996通過經濟分析去解釋或預測傳統經濟學沒有涉入且是其他社會科學傳統研究領域中的現象,并且這種努力還多少獲得了一定成功(貝克爾,1997科學界包括經濟學界都招來了批評聲,而這種行為本身又被斥之以“經濟學帝國主義”6因素的社會經濟現象時,他們所面對的巨大復雜性是可想而知的?!獙嶋H上正是由于缺乏真實性——但研究這對建筑物的影響,盡管建筑模型與真實的建筑物相比完全是不同的東西。型也不包括經濟的每一個特征。從古代人的天圓地方學說到托勒密的宇宙模型到牛頓力學到現代量子論和相對論測。7評論并在不同的經濟政策之間進行選擇,這就是現代經濟學普遍使用數學語言的原因。數學方法在科學研究中往往還會為科學家帶來完全憑直覺無法獲得的正確結果。譬如,上難以想象的情形——物質會在引力作用下發生坍塌,即引力場方程存在“奇點”解。驗使得當代物理學家們開始對數學上的結果持認真態度,以至于物理學家們如是寫道:2000P241的不可思議的預測力,如狄拉克通過將相對論引入量子力學方程而發現正電子的預言,————真空中發生作用的假設對研究大理石的下落是適用的,但對研究氣球的下落并不適用。但是,當你問一個物理學家,一塊大理石從10層樓的頂端掉下來需要多少時間,他會8多假設來限定所考慮的研究范圍和簡化模型,只有這樣才可能獲得明確的結論和預測。用假設來簡化分析的弊病——人想必是一位經濟學家。盤水利工程模型等,但在物理學和經濟學中,常用的是數學模型。模型的功用在于科學家們可以用它對即將發生的事件進行預測或者用它對已經發——這個“理論”完全——只要明天不下雨——9家們認為,理論是否科學要看理論是否能被實踐證明是正確的,即理論是否能被驗證。么能說既往的實踐能證明實踐能證明理論的正確性呢?因為既往的實踐也是有限的呢40150——humedilemma性,因為將理論的科學性定義為理論的正確性在研究中是不可操作的。事實上,年代在澳洲就發現了黑天鵝——過去并不能證明未來!10找衡量理論的科學性標準打開了一條思路——這正是劍橋哲學家波普爾的證偽主義哲——試圖將所有存在于大——統一為一種基本力時,——還對科學家的思維產生了重要影響。許多當代科學家都一致認為證偽主義哲學所描述的正是科學家通常所進行的思維學所說的正是我長期所采用的思考方法。的思路去建構判定理論的科學性的準則。我們所能夠做的就是退后一步——不去試圖證實理論的正確性——而是去看是否論是具有更好預測能力的理論,如果一個新的理論能預測原來的舊理論不能預測的事還未找到一個更好的理論取代它罷了!我們相信現有理論在未來會被新的理論所取代,斷競爭理論的提出完全是基于其假設比完全競爭和完全壟斷理論的假設更為現實。這——只留下唯一的一個均衡——有咫尺之遙了!2.1.3經濟學與經濟模型數學模型的鼻祖大概要追溯到世紀英國經濟學家威廉·配弟那里,但數理經濟學(MathematicalEconomics)的真正先驅是19世紀的法國經濟學家古諾(Cournot始于1870年左右,當時奧地利學派的門格爾、英國劍橋大學的杰文斯和瑞士洛桑大學19世紀還未出現可以用來證明一般均衡解的存在唯一性的數學方法,而這要等到20世紀50Debreu1959布魯因此于1983到了20世紀初期,新古典經濟學才由劍橋學派創始人馬歇爾集其大成。馬歇爾本12——這正是模型的復雜性影響了模型的態的主要特征。他將物理學中的上述“平衡”概念在經濟學中的類比概念稱為“均衡”(equlibrium消的情形(在瓦爾拉那里,盡管他最早提出了一般均衡的思想,但還沒有使用“均衡”13功能——即將均衡作為對實際經濟現象的預測。互競爭的經濟行為主體情況下才是充分有效的,即其預測結果才是較為準確的。相反,
行為主體對其各種行為選擇的預期反應,從而在效用最大化決策中需要納入這種反應,
潤不僅是其自身價格和產量決定的函數,而且還是其他寡頭企業價格和產量決定的函
20世紀30年代提出了壟
14研究上主要還是采用馬歇爾的略去了經濟行為主體間互動過程的局部均衡模型。但是,
有效處理經濟行為主體數目較少的情形,而原有的馬歇爾式簡化方法可以作為一種特
例。這樣,經濟學在方法論上獲得革命性進步,因為博弈論將經濟分析的效率提高了,將經濟分析的有效范圍也拓寬了。在1997)
的經濟學前沿研究領域。KrepsKreps,1990)在寡頭壟
斷內容部分全部用博弈論處理,使得該書迅速蜚聲國際經濟學界。在1940年代末和整
個1950年代,塔克教授在普林斯頓大學講授博弈論,舉辦博弈論討論班,從而培養出
工廠的大批“產品”在國際經濟學界開始產生影響,博弈論于1970年代以后風靡經濟學各個領域,并逐漸上升到作為主流經濟學的基本方法論的地位。Nash策略選擇上的互動,其預測能力是要大打折扣的。譬如,我們考慮表2.1中的雙變量矩
A和B分別代表兩個局中人,用U
和D表示A的二個可選擇行動,L和R表示B的兩個可選擇行動,矩陣中的每一小方
格中的一雙數字分別表示當A和B正好選擇該小方格對應的行動時各自所獲得的支付,
習慣上小方格中左邊第一個數字表示A的支付,第二個數字表示B的支付。15表2.1二人博弈的支付矩陣BLRAU3,22,3D4,53,3我們先通過“最大最小”方法找出博弈的均衡解。當A選行動U時,A可能獲得的最小支付為2(當B選RA選行動D時,A可能獲得的最小支付為3(當B選RA不知道B會選L還是選R,所以為了保險,假定A會選使A會選B可能會選RA選B選RR)表示,括號中第一個符號表示A的均衡行動,第二個符號表示B的均衡行動。但是,局中人A和B果真會按上述預測的均衡進行選擇嗎?讓我們從另一個角度來看看另一種預測方法。我們納入A和B之間的互動。顯然,對A來說,無論B是選L還是選R,A選D的支付都大于選U的支付,所以,A不會選,我們稱行動D是dominantU的[1]DA只會選擇占優戰略。然后,我們再來看B。根據理性人假定,B也知道A會選A那樣選擇行動A選B當然會選LRLA選,B應選L而非R。均衡”。在博弈論中,含有占優戰略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,2816罪名將兩人各判入獄1年。表2.2給出了這個博弈的支付矩陣。表2.2囚徒困境博弈B坦白抵賴A坦白–8,0,–10抵賴–10,0–1,AB作何選擇,但他知道無論BB也會選812.2白”是任一犯罪嫌疑人的占優戰略,而(坦白,坦白)是一個占優戰略均衡。2.3。表2.3不存在占優戰略均衡的二人博弈BLRAU4,32,5D3,86,7A和B都沒有占優戰略。當B選LA選U獲得的支付比選D獲得的支B選RA選D獲得的支付比選UA選U時,B選R獲得的支付比選L獲得的支付要大,當A選D時,B選L獲得的支付又比選R獲得的支付要大。因此,A和B都沒有占優戰略。貢獻的納什在1950年代完成了一系列創造性研究工作,他提出的“納什均衡”在非常17DebreuGlicksberg,Fan等人又給出了納什存在性定理的幾種不同形式和在一定程seltenkreps等人在動態博弈方擇其戰略。只不過在合作博弈場合,違反協議帶來的局中人個人成本可能是無限大而表2.4存在一個納什均衡的二人博弈BLMRAU3,14,51,6D7,82,72,3略時,這時的戰略組合就構成一個納什均衡。在表2.4A和BA選擇B選擇LB選擇L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年江蘇省常州市教育學會學業水平監測物理高一第二學期期末學業水平測試試題含解析
- 博物館管理辦法書寫格式
- 上海市建設工程管理辦法
- 重慶節水灌溉管理辦法
- 《食品召回管理辦法》中
- 云巖區清潔管理辦法細則
- 省級媒體收費管理辦法
- 淄博高血壓慢病管理辦法
- 重慶招標屬地管理辦法
- 2025年吉林省洮南市第十中學高一物理第二學期期末教學質量檢測模擬試題含解析
- 護理核心制度考試試卷(附答案)
- 尾礦工安全培訓
- 西安高新區管委會招聘筆試真題2024
- 2025年中國工商銀行招聘筆試備考題庫(帶答案詳解)
- 研發項目工時管理制度
- 浮選藥劑安全管理制度
- 會陰水腫硫酸鎂濕敷專題報告
- 技術異化的解放路徑-洞察及研究
- 考試錄用公務員筆試監考工作培訓
- GM∕T 0036-2014 采用非接觸卡的門禁系統密碼應用指南
- 內蒙古高中畢業生學籍表畢業生登記表學年評語表成績單身體健康檢查表完整版高中檔案文件
評論
0/150
提交評論