




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、背景知識:納什博弈論的原理與應用1950年和1951年納什的兩篇關于非合作博弈論的重要論文,徹底改變了人們對競爭和 市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納 什均衡。從而揭示了博弈均衡與經濟均衡的內在聯系。納什的研究奠定了現代非合作博 弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現 卻遭到馮諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子里挑戰權 威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。要不是30多年的嚴 重精神病折磨,恐怕他早已站在諾貝爾獎的領獎臺上了,而且也絕不會與其他人分享這一殊榮。納什是一個非
2、常天才的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士 學位時做出的。然而,他的天才發現非合作博弈的均衡,即“納什均衡”并不是一帆風順的。1948年納什到普林斯頓大學讀數學系的博士。那一年他還不到20歲。當時普林斯 頓可謂人杰地靈,大師如云。愛因斯坦、馮諾依曼、列夫謝茨(數學系主任)、阿爾伯 特塔克、阿倫佐切奇、哈羅德庫恩、諾爾曼斯蒂恩羅德、埃爾夫福克斯 等全都在這里。博弈論主要是由馮諾依曼(19031957)創所立的。他是一位出生于匈 牙利的天才的數學家。他不僅創立了經濟博弈論,而且發明了計算機。早在20世紀初, 塞梅魯(Zermelo)、鮑羅(Borel)和馮諾伊曼已經開始研究
3、博弈的準確的數學表達,直 到1939年,馮諾依曼遇到經濟學家奧斯卡摩根斯特恩(Oskar Morgenstern),并與 其合作才使博弈論進入經濟學的廣闊領域。1944年他與奧斯卡摩根斯特恩合著的巨作博弈論與經濟行為出版,標志著現 代系統博弈理論的的初步形成。盡管對具有博弈性質的問題的研究可以追溯到19世紀 甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產量與價格壟斷;2000多年前中國著名軍事家孫武的后 代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星 的,片斷的研究,帶有很大的偶然性,很
4、不系統。馮諾依曼和摩根斯特恩的博弈論 與經濟行為一書中提出的標準型、擴展型和合作型博弈模型解的概念和分析方法,奠 定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼 的博弈論的局限性也日益暴露出來,由于它過于抽象,使應用范圍受到很大限制,在很 長時間里,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有 限。正是在這個時候,非合作博弈“納什均衡”應運而生了,它標志著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們 根本想不起來曾經什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至 少上過斯蒂恩羅德的代數拓
5、撲學。斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾 次課,納什就認定這門課不符合他的口味。于是,又走人了。然而,納什畢竟是一位英 才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯 學、博弈論等等,深深地為之著迷。納什經常顯示出他與眾不同的自信和自負,充滿咄 咄逼人的學術野心。1950年整個夏天納什都忙于應付緊張的考試,他的博弈論研究工作 被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的“放棄”,使原來模糊、雜亂和 無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感! 這一年的10月,他驟感才思潮涌,夢筆生花。其中一個最耀眼的亮點就是日后被稱
6、之 為“納什均衡”的非合作博弈均衡的概念。納什的主要學術貢獻體現在1950年和1951 年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合 作博弈”的長篇博士論文,1950年11月刊登在美國全國科學院每月公報上,立即引起 轟動。說起來這全靠師兄戴維蓋爾之功,就在遭到馮諾依曼貶低幾天之后,他遇到 蓋爾,告訴他自己已經將馮諾依曼的“最小最大原理(minimax solution)推到非合 作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終于意識到納什的思 路比馮諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極 為贊嘆。蓋爾建議他馬上整理
7、出來發表,以免被別人捷足先登。納什這個初出茅廬的小 子,根本不知道競爭的險惡,從未想過要這么做。結果還是蓋爾充當了他的“經紀人”, 代為起草致科學院的短信,系主任列夫謝茨則親自將文稿遞交給科學院。納什寫的文章 不多,就那么幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思 的。國內提一個教授,要求在“核心的刊物”上發表多少篇文章。按照這個標準可能納 什還不一定夠資格。1996年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒 有發表過什么文章,特殊的人才,必須有特殊的選拔辦法。納什在上大學時就開始從事純數學的博弈論研究,1948年進入普林斯頓大學后更是 如魚得水。
8、20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃 時代的貢獻,是繼馮諾依曼之后最偉大的博弈論大師之一。他提出的著名的納什均衡 的概念在非合作博弈理論中起著核心的作用。后續的研究者對博弈論的貢獻,都是建立 在這一概念之上的。由于納什均衡的提出和不斷完善為博弈論廣泛應用于經濟學、管理 學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。囚犯的兩難處境大理論中的小故事要了解納什的貢獻,首先要知道什么是非合作博弈問題。現在幾乎所有的博弈論教 科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。博弈論畢竟是數學,更確切地說是運籌學的一個分支,談經論道自然少不了數學語
9、言,外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題,所以不 能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的 問題中借用的術語,聽上去有點玄奧,實際上卻具有重要現實意義。博弈論大師看經濟 社會問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人 小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和 那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人, 辯稱是先發現富翁被殺,然后只是順手牽羊偷了點兒東西。于
10、是警方將兩人隔離,分別 關在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,“由于你 們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個交易。 如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同伙要被判十年刑。如果 你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監禁。但是,如 果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎么 辦呢?他們面臨著兩難的選擇一一坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是 大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當斯密 的理論,每一個人都是從利己的目的
11、出發,他們選擇坦白交代是最佳策略。因為坦白交 代可以期望得到很短的監禁3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦 白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應 該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以, 兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出 現。這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為“納什均衡”,也叫非 合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供,他們只是選擇對自己最 有利的策略
12、,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所 有局中人(也稱當事人、參與者)的最佳策略組合構成。沒有人會主動改變自己的策略以 便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體 理性的沖突,各人追求利己行為而導致的最終結局是一個“納什均衡”,也是對所有人 都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長 的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時 間的監禁的結果。“納什均衡”首先對亞當斯密的“看不見的手”的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終
13、全社會達到利 他的效果。不妨讓我們重溫一下這位經濟學圣人在國富論中的名言:“通過追求(個 人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。”從“納什 均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發,結果損人不利 己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提 出的悖論實際上動搖了西方經濟學的基石。因此,從“納什均衡”中我們還可以悟出一 條真理:合作是有利的“利己策略,。但它必須符合以下黃金律:按照你愿意別人對你 的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿 施于人”。但前提是人所不欲勿施于我。其次,
14、“納什均衡”是一種非合作博弈均衡, 在現實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮諾依曼和摩根斯 特恩的合作博弈理論的重大發展,甚至可以說是一場革命。從“納什均衡”的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國 防、管理和日常生活中的博弈現象。我們將例舉出許多類似于“囚徒的兩難處境”這樣 的例子。如價格戰、軍奮競賽、污染等等。一般的博弈問題由三個要素所構成:即局中 人(players)又稱當事人、參與者、策略等等的集合,策略(strategies)集合以及每一 對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關 系被選擇,每一局中人所
15、得到的效用。所有的博弈問題都會遇到這三個要素。價格戰博弈:現在我們經常會遇到各種各樣的家電價格大戰,彩電大戰、冰箱大戰、空調大戰、 微波爐大戰這些大戰的受益者首先是消費者。每當看到一種家電產品的價格大戰, 百姓都會“沒事兒偷著樂”。在這里,我們可以解釋廠家價格大戰的結局也是一個“納 什均衡”,而且價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結 果是穩定的,即是一個“納什均衡”。這個結果可能對消費者是有利的,但對廠商而言 是災難性的。所以,價格戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個 問題,一是競爭削價的結果或“納什均衡”可能導致一個有效率的零利潤結局。二是如 果不
16、采取價格戰,作為一種敵對博弈論(vivalry game)其結果會如何呢?每一個企業, 都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。 如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經營所做的,通常 會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點, 我們又引出一條基本準則:“把你自己的戰略建立在假定對手會按其最佳利益行動的基 礎上”。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀 態下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中, 每一企業要使利潤最大化,消費者要使效用
17、最大化,結果導致了零利潤,也就是說價格 等于邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。 如果廠商采取合作行動并決定轉向壟斷價格,那么社會的經濟效率就會遭到破壞。這就 是為什么WTO和各國政府要加強反壟斷的意義所在。污染博弈:假如市場經濟中存在著污染,但政府并沒有管制的環境,企業為了追求利潤的最大 化,寧愿以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理, 所有企業都會從利己的目的出發,采取不顧環境的策略,從而進入“納什均衡”狀態。 如果一個企業從利他的目的出發,投資治理污染,而其他企業仍然不顧環境污染,那么 這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要 破產。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀90年 代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染 管制時,企業才會采取低污染的策略組合。企業在這種情況下,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CGCC 23-2018奢侈品鑒定技術規范
- T/CFDCC 0207-2019定制家居產品安裝服務規范
- T/CECS 10262-2022綠色建材評價二次供水設備
- T/CECS 10113-2020高強輕骨料
- T/CECIA 02-2020企業社會責任管理體系要求
- T/CCSAS 019-2022加氫站、油氣氫合建站安全規范
- T/CCOA 3-2019花生油質量安全生產技術規范
- T/CCIASD 10006-2023多式聯運經營人基本要求及等級評估指標
- T/CCAS 015-2020水泥助磨劑應用技術規范
- T/CAQI 47-2018飲用水售水機技術要求
- 【MOOC】中西文化鑒賞-鄭州大學 中國大學慕課MOOC答案
- 《工貿企業重大事故隱患判定標準(冶金行業)》知識培訓
- 四川盆地果樹病蟲害綠色防控-終結性考核-國開(SC)-參考資料
- 鉆井及井下作業井噴事故典型案例
- 小紅書食用農產品承諾書示例
- CQI-23模塑系統評估審核表-中英文
- 中考英語1600核心詞匯
- 《高血壓科普知識》課件
- 空調維保服務投標方案 (技術方案)
- CSTM-鋁灰用于替代鋁土礦石技術規范編制說明
- 詢價函模板范文
評論
0/150
提交評論