


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.論納什均衡與“囚徒困境的解決方式摘要 本文對于“囚徒困境與納什平均進展了簡要分析,提出了靜態博弈中要找出自己的優勢策略以及動態博弈中合作重要性的觀點。關鍵詞:“囚徒困境 優勢策略 合作一、 “囚徒困境博弈及其納什均衡“囚徒困境博弈是圖克Tucker1950年提出的一個著名的博弈模型,是完全信息靜態博弈的典型例子。囚徒困境博弈的根本情況如下:警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據指證他們所犯的罪行。如果其中至少有一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關押以防止他們串供或結成攻守同盟,并給他們同樣的選擇時機;如果他們兩人都拒不認罪,那么他們會被以較輕的
2、阻礙公務罪各判1年徒刑;如果兩人中有一人坦白認罪,那么坦白者從輕認罪,立即釋放,而另一人那么將重判8年徒刑;如果兩人同時坦白認罪,那么他們將被各判5年監禁如果分別用1、5和8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即釋放的得益,那么兩囚徒的得益矩陣如下: 囚徒2坦白不坦白坦白-5,-50,-8不坦白-8,0-1,-1 囚徒1在上圖中,“囚徒1、“囚徒2分別代表本博弈中的兩個博弈方,也就是兩個罪犯;他們各自都有“不坦白和“坦白兩種可選擇的策略;因為這兩個囚徒被隔離開,其中任何一人在選擇策略時都不可能知道另一人的選擇是什么,因此不管他們決策的時間是否真正一樣,我們都可以把他們的決策
3、看作是同時做出的。其中矩陣中第一個數字代表決策結果后囚徒1的得益,第二個數字代表決策結果后囚徒2的得益。 博弈的結果是:由于這兩個囚徒之間不能串通,并且各人都追求自己的最大利益而不會顧及同伙的利益,雙方又都不敢相信或者說指望對方有合作精神,因此只能實現對他們都不理想的結果各判5年,并且這個結果具有必然性,很難擺脫,因此這個博弈被稱為“囚徒困境。二、 尋找自己的優勢策略從“極小極大原理到“納什理論,都是希望提醒博弈中的策略選擇和博弈結果之間的關系,使博弈論研究可以在一個博弈構造里尋找比擬穩定的結果,并為策略的選擇提供依據。比方在“囚徒困境中,雙方招供是“理性的解,因為就單方面來說,無論對方招不招
4、供,你招供都是最正確決策,于是結果就是雙方招供,這個結果其實并不好,但最可能出現。為什么會出現這個不好的結果呢.因為對于任何一方來說,這個結果還不是最壞的總比自己單獨受過要好。這符合決策的“極小極大原理的,正如著名作家卡爾維諾在"寒冬夜行人"中所說:“有時候,你能指望的最正確結果就是防止最壞情況。這句不經意的話其實完全可以作為“極小極大原理的一個淺顯易懂的定義。當身處類似“囚徒困境這樣同時行動的靜態博弈中時最正確策略是什么.“極小極大原理告訴我們:雙方的策略選擇往往是有跡可循的,并形成某種“定式,既然如此,只要找到方法提醒這個定式,就可以為自己的策略選擇找到依據,同時也可以
5、知道博弈的結果。什么是優勢策略.即某些時候它勝于其他策略,且任何時候都不會比其他策略差。假設一個玩家擁有這么一個策略,他的決策將會變的非常簡單,因為他可以選擇這個優勢策略,完全不必擔憂其他對手怎么行事。很多人誤解了優勢策略的“優勢終究是對什么而言的,所謂“優勢策略是指無論對手采用什么策略,你的這個策略的結果都要比你選擇其他策略更好,而不是對你的對手的策略占有優勢。另一個常見的誤解在于一個優勢策略必須滿足一個條件,即采用優勢策略得到的最壞結果也要比采用另外一個策略得到的最正確結果好,但這并非優勢策略的普遍特征。比方“囚徒困境中“背叛是雙方的優勢策略,但“雙方背叛結果卻并不比“雙方合作好。不是所有
6、博弈都有優勢策略,實際上優勢與其說是帶有一定規律性,不如說是一種例外。雖然出現一個優勢策略可以大大簡化行動的規那么,但這些規那么卻并不適用于大多數現實生活中的博弈。三、 重復“囚徒困境:合作是可能的一對未來的預期,是影響人們行為的重要因素。如果未來是重要的,那么就不存在制勝策略。在“囚徒困境中,“社會人和“理性人是有區別的,為什么可以在邏輯上得到完美證明的“囚徒困境,并不能成為人們普遍遵循的選擇.于是,現在的問題變成了尋找如何進展合作的充分必要條件了。顯然,生活中的人們打交道通常不是一次性的。那么,參加博弈次數又會怎樣.設想這個游戲要進展屢次,而且雙方都知道具體次數,那么雙方仍然沒有合作的動機
7、:首先,最后一次大家顯然是不合作的。在倒數第二次時,雙方還是沒有合作的動機。因為她們都預知對方在最后一次會背叛。如此推理下去,對兩位自私者任何次數的游戲,從第一次開場就是雙方背叛。然而,這個推理并不適用于游戲要進展無限屢次的情況。當游戲次數無限時,合作是有出現的可能。在實際生活中,對未來的預期是影響人們行為的重要因素。一種是預期收益:這樣做將會有什么好處;一種是預期風險:這樣做將會面臨什么問題。這些考慮會影響到人們現實的選擇。比方像地攤、車站、旅游點這樣的人群流動性大的地方,不但商品和效勞質量最差,而且假貨橫行,因為這里商家不必為未來考慮一個旅客不大可能因為你的飯菜可口而再次光臨,一錘子買賣不
8、賺白不賺。而在比擬穩定的人際關系中,人們就普遍比擬注意禮節和誠信,因為在這個環境里,人們不能不考慮長期影響。從消極的層面看,我們互不侵犯,是為了防止沒完沒了、兩敗俱傷的循環報應。二在一個“非零和博弈中,贏得良好的結果往往不是靠戰勝對方,而是靠引導對方做出對雙方都有利的行為。人們往往習慣考慮零和對局,在這種情況下,一個人贏,另一個就輸。為了能贏,一個參賽者必須在大局部時間里比對手做得更好。然而生活中的大多數情況都是非零和的。雙方可以都做得很好,也可以都做得很差。合作是可能的,但并不是總能實現。這就是為什么“囚徒困境是各種各樣的日常情形的有用模型。人們傾向于采用相對的標準,這個標準經常把對方的成功與自己對立起來,這種標準導致了嫉妒,嫉妒導致企圖抵消對方已經得到的優勢,在“囚徒困境的形勢下,抵消對方優勢只能通過背叛來實現,但是背叛將導致更多的背叛和對雙方的懲罰。因此在一個非零和的世界里,沒有必要非得比對方做得更好。特別要和許多不同的對手打交道時更是這樣。只要自己能做得好就沒有理由去嫉妒對方的成功。因為在長時間的“重復囚徒困
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能網聯汽車技術概論復習題及答案
- 焊縫大小頭項目投資可行性研究分析報告(2024-2030版)
- 青少年眼健康指南
- 中國灌溉農業行業市場深度分析及行業發展趨勢報告
- 藥店服務培訓課件
- 2024-2030年中國老婆餅行業市場發展監測及投資潛力預測報告
- 2025年 危險化學品生產單位安全生產考試練習題附答案
- 2025年 勞動關系協調員理論考試模擬練習題附答案
- 中國實驗室安全柜行業發展監測及投資戰略研究報告
- “十三五”規劃重點-海洋波浪發電生產建設項目建議書(立項報告)
- 國家開放大學《創建小企業》形考任務1-4參考答案
- 企業常見稅務風險及應對精講課件
- 2024年貴州省貴陽市中考生物地理合卷試題(含答案逐題解析)
- DL∕T 740-2014 電容型驗電器
- 蘇州市2023-2024高二下學期期末地理試卷及答案
- 辦公室主任試用期工作總結范文
- MOOC 人工智能基礎-國防科技大學 中國大學慕課答案
- 數學的天空智慧樹知到期末考試答案2024年
- 情商認知與提升智慧樹知到期末考試答案2024年
- 健康與免疫智慧樹知到期末考試答案2024年
- 知識產權校園講座
評論
0/150
提交評論