




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數學文化與思維主講人:吳東靈博弈論劇情回顧
影片中有這樣一個情節:在美國普林斯頓大學的酒吧里,4個男生正商量著如何去追求一位漂亮女生,當時還正在大學讀書的納什卻在朦朧的“博弈論”思維邏輯引導下喃喃自語:“如果他們4個人全部去追求那漂亮女生,那她一定會擺足架子,誰也不睬。然后再去追其他女孩子,別人也不會接受,因為沒人愿意當‘次品’。但如果他們先追其他女生,那么漂亮女生就會感到被孤立,這時再追她就會容易得多。”在納什眼里,追求女生就是一場“博弈”,而“博弈”是要遵循一定規則的,是需要“博弈”策略的。博弈論是什么?博弈論又被稱為對策論(GameTheory)既是現代數學的一個新分支,也是運籌學的一個重要學科。博弈論是研究具有斗爭或競爭性質現象的數學理論和方法。它考慮游戲中的個體的預測行為和實際行為,并研究它們的優化策略。目前已被廣泛運用到各個領域,在經濟學中取得了尤為突出的發展。戰爭是怎樣發生的?
8歲的男孩問父親:“爸爸,戰爭是怎樣發生的?”男孩的父親回答:“很簡單。比如說第一次世界大戰的爆發,是因為德國入侵比利時……”在一旁的妻子立即打斷他的話:“你講的不對。第一次世界大戰的起因是有人在薩拉熱窩被刺殺了。”丈夫聽了一臉不悅,沖妻子不耐煩地說道:“是你回答這個問題,還是我回答?”妻子聽了也是滿臉的不高興,她轉身跑出起居室,砰的一聲將門關上。緊接著,從廚房里傳出了碗碟猛摔在地上的聲音,過了一會兒,整個屋子陷入死一般沉寂。男孩眼眶里含著淚水,輕聲說:“爸爸,你不用說了,我知道戰爭是怎樣發生的了."遠觀博弈論夫妻二人以一種兩敗俱傷的方式,使自己的孩子明白了戰爭的發生和夫妻兩個人吵架之間的內在關聯:讓國家之間一步一步走向世界大戰的機制,同樣也正是同一屋檐下夫妻失和的原因。也就是說,無論是國與國之間,還是人與人之間的合作和沖突,其中所蘊含的博弈原理是大同小異的。諾貝爾經濟學獎得主奧曼在權威的《帕爾格雷丈夫辭典》中,對“博弈論”此條的解釋十分精辟和凝練。他認為,博弈論描述性的名稱應該是“互動的決策論”。因為人們之間的決策與行為會形成互為影響的關系,一個主體在決策時必須考慮到對方的反應。博弈的形成博弈的目的是利益,利益形成博弈的基礎。最基本的假設就是經濟人或理性人的目的就在于使收益最大化。參與博弈者正是為了自身收益的最大化而互相競爭。參與博弈的各方形成相互競爭、相互對抗的關系,以爭得利益的多少來決定勝負,一定的外部條件又決定了競爭和對抗的具體形式。這樣就形成了博弈。簡單的案例夫妻倆下班回到家,吃完晚飯想看電視。電視預報顯示,一個頻道會播放丈夫喜愛的足球賽,而另一個頻道會播放妻子喜愛的選秀節目。但是家里只有一臺電視機。這樣,圍繞著到底看什么節目。一場博弈就展開了。要素分析在這場博弈中,完整地包含了形成一個博弈的4個要素:(1)2個或2個以上的參與者(player)。
博弈中必需的條件:不是一個人在一個毫無干擾的環境中做決策。(2)博弈要有參與各方爭奪的資源或收益(resources/payoff)
資源指的不僅僅是自然資源,還包括了各種社會資源,如人脈、信譽、學歷、職位等。人們之所以參與博弈是受到利益的吸引,將來所獲得利益的大小直接影響到博弈的吸引力和參與者的關注程度。
簡單說就是:凡是自己主觀需要的就是資源;相反,主觀不需要的對自己就不能構成資源。這就是“情人眼里出西施”的道理。要素分析(3)參與者有自己能夠選擇的策略(strategy)
通俗地說,策略就是計策,是博弈參與者所選擇的手段和方法。制定博弈論中的策略,要先對局勢和整體狀況進行分析,確定局勢特征,再找出其中關鍵因素,最后才進行手段選擇。
由此可見,博弈論中的策略是牽一發而動全身的,直接對整個局勢造成重大影響。(4)參與者擁有一定量的信息(information)
博弈就是個人或組織在一定的環境條件與已定的規則下,同時或先后,一次或是多次選擇策略并實施從而得到某種結果的過程。案列分析上述“夫妻博弈”模型大致會出現三種情況:一是兩人爭執不下,于是干脆關掉電視,誰都別看;二是你看足球,我到其他地方看選秀,或你看選秀,我到其他地方看足球;三是其中一方說服另一方,兩人同看足球或同看選秀節目。案例分析夫妻二人通常不會因為電視節目的分歧而分開活動的。這是研究該問題的潛在前提。但是,對于看什么節目,雙方又各有偏好。因此我們可以假定:如果丈夫和妻子分開活動,男女雙方的效用為0,如果雙方一起去看球賽,則丈夫的效用為5,而妻子的效用為1;如果雙方一起看選秀,則丈夫的效用為1,妻子的效用為5。案例分析
根據上述假定夫妻雙方不同選擇的所有結果及其效用組合如下表。
就是這樣一個矩陣,可以一目了然地把我們介紹的幾種因素包含在里面。
矩陣是博弈論中用來描述兩個或多個參與人的策略和效用的最常用工具,又被稱為“收益矩陣”或“得益矩陣”。均衡思想
均衡可以說是博弈論中最重要的思想之一,但是卻并不復雜。我們可以用描述法來加以定義:在博弈達到均衡時,局中的每一個博弈者都不可能因為單方面改變自己的策略而增加收益,于是各方為了自己利益的最大化而選擇了某種最優策略,并與其他對手達成了某種暫時的平衡。在外界環境沒有變化的情況下,倘若各方堅持原有的利益最大化原則并理性面對現實,那么這種平衡狀況就能夠長期保持穩定。納什均衡
在所有的均衡中,“納什均衡”又是一個基礎性的概念。簡單地說,所謂“納什均衡”就是所有人的選擇綜合在一塊,不一定所有選擇都能實現最大化原則,但能使所有人都達到最大化的均衡狀態。
納什均衡是一種最常見的均衡。在納什均衡點上,每個參與者的策略是最好的,此時沒有人愿意先改變或主動改變自己的策略。也就是說此時如果他改變策略,他的收益將會降低,每一個理性的參與者都不會有單獨改變策略的沖動。納什均衡不僅要求所有的博弈參與人都是理性的,而且要求每個參與人都了解所有其他參與人也都是理性的。需要注意的是,博弈的結果并不都能成為均衡。博弈的均衡是穩定的,因此可以預測。輕松一刻在斯大林時代的蘇聯,一位樂隊指揮坐火車前往下一個演出地點。正當他在車上翻看當晚就要指揮演奏的作品樂譜時,兩名克格勃(KGB,蘇聯國家安全警察,實際是政治特務)將他作為間諜逮捕了。他們以為那樂譜是某種密碼。這位樂隊指揮爭辯說那只是柴可夫斯基的小提琴協奏曲,根本無濟于事。在樂隊指揮被投入牢房的第二天,審問者自鳴得意地走進來說:“我看你最好還是老實招了吧,我們已經抓住你的朋友柴可夫斯基了。他這會兒正向我們交代呢。你如果再不招就槍斃了你。如果交代了,只判你10年。”經典模型之一:囚徒困境模型
1950年,擔任斯坦福大學客座教授的數學家圖克(Tucker),給一些心理學家解釋他正在研究的完全信息靜態博弈問題。為了更形象地說明博弈過程,他用兩個犯罪嫌疑人的故事構造了一個博弈模型,即“囚徒困境模型”。
這一模型的過程具體是這樣的:囚徒困境模型兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局。警方對兩名犯罪嫌疑人實行隔離關押,隔離審訊,每個犯罪嫌疑人都無法觀察到同伴的選擇。警方懷疑他們作案,但手中并沒有掌握確鑿證據,于是明確地分別告知兩名犯罪嫌疑人,對他們犯罪事實的認定及相應的罪刑完全取決于他們自己的供認。警方提出條件如下:囚徒困境模型分析
兩名囚徒面臨的選擇及其帶來的后果組合用收益矩陣表示如下:哪一種選擇對犯罪嫌疑人更有利呢?囚徒困境模型分析
從上表中可以知道:每個犯罪嫌疑人都有兩種可供選擇的策略:供認或抵賴。而且,每個犯罪嫌疑人選擇的最優策略不依賴于其同伙的策略選擇。如果甲選擇抵賴,那么就可能會出現兩種情況:如果乙選擇供認,那么甲將被加重懲罰,判刑10年,而乙則無罪釋放;如果乙也同樣選擇抵賴,那么他們兩個都將因證據不足而被釋放。很顯然,這第二種結果對于兩個人都是最有利的。但是,因為警方沒有把兩名嫌疑人放在一間囚室里,因而這種合作難以順利進行,使得結果預測的不確定性加大,或者說增加了抵賴合作的風險性。
因此,基于人是理性的這一前提。由于犯罪嫌疑人不知道對方的想法,最理性的博弈策略,就是選擇供認。這時的策略,我們可以稱為占優策略。占優策略與劣勢策略
而如果所有參與人都有占優策略存在,那么博弈將在所有參與人的占優策略的基礎上達到均衡,這種均衡稱為占優策略均衡。在囚徒困境中,“甲供認,乙供認”就是占優策略均衡,因為不管甲乙兩人誰供認,都將得到減輕懲罰的結果:如果甲供認了,乙抵賴。甲將免于懲罰,如果乙也供認了,那么罪名各擔一半,從甲個人看來,也減輕了懲罰;甲乙互換位置,結果依然是一樣。顯然,這一策略是一個占優策略。
與占優策略相對應,劣勢策略則是指在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對自己嚴格不利的策略。
有一個要注意的問題是,采用優勢策略得到的最壞結果,并不一定比采用其他策略得到的最佳結果要好。應該說,參與人采用優勢策略時,無論對方采取任何策略總能夠顯示出優勢。聰明還是不聰明?兩個旅行者從一個出產細瓷花瓶的地方回來,都買了花瓶。可是提取行李的時候,發現花瓶被摔壞了。于是。他們向航空公司索賠。航空公司知道花瓶的價格總在八九十元上下浮動,但是不知道兩位旅客買的確切價格是多少。于是,航空公司請兩位旅客在100元以內自己寫下花瓶的價格。如果兩人寫的一樣,航空公司將認為他們講的是真話,并按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就論定寫得低的旅客講的是真話,并且照這個低的價格賠償。但是對講真話的旅客獎勵10元錢,對講假話的旅客罰款10元。為了獲取最大賠償,甲乙兩位旅客最好的策略就是都寫100元,這樣兩人都能夠獲賠100元。可是甲很聰明,他想:如果我少寫1元變成99元,而乙會寫100元,這樣我將得到109元。何樂而不為?所以他準備寫99元。可是乙更加聰明,他算計到甲要算計自己而寫99元。“人不犯我,我不犯人,人若犯我,我必犯人”,于是他準備寫98元。想不到甲又聰明一層,算計出乙要這樣寫98元來坑他,“來而不往非禮也”,他準備寫97元…
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/SDHTS 00004-2024瀝青拌和站回收粉環保型鋪面磚應用技術規程
- T/CNCA 051-2023煤礦用煤位傳感器通用技術條件
- 2025年采購軟件設備合同5篇
- 購買室內IC卡兼容機合同書樣本3篇
- 上海梅園中學試題及答案
- 上海中考化學試題及答案
- 提供技術咨詢合同書5篇
- T/CCOA 81-2023植物油儲藏安全預警及控制技術規程
- 簡單的股份合作協議范本書5篇
- 新版設備租賃合同2篇
- 違法用地違法建設培訓
- 玉盤二部合唱簡譜
- JJF(皖) 218-2025 重點排放單位碳排放計量審查規范
- 全國各地大氣壓一覽表
- 2025年執業醫師定期考核題庫及參考答案
- 日間手術流程規范
- 2024年09月2024秋季中國工商銀行湖南分行校園招聘620人筆試歷年參考題庫附帶答案詳解
- 《冬病夏治》課件
- 系統維護崗位職責
- 《攀巖基礎常識》課件
- (新版)妊娠期惡心嘔吐及妊娠劇吐管理指南解讀
評論
0/150
提交評論