《博弈與社會》期末筆記_第1頁
《博弈與社會》期末筆記_第2頁
《博弈與社會》期末筆記_第3頁
《博弈與社會》期末筆記_第4頁
《博弈與社會》期末筆記_第5頁
已閱讀5頁,還剩13頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《博弈與社會》期末筆記第一章:導論1.1博弈論的起源與發展博弈論作為一門學科,起源于20世紀初。其最初的發展與數學家們對策略和決策的興趣密切相關。約翰·馮·諾依曼(JohnvonNeumann)和奧斯卡·摩根斯坦(OskarMorgenstern)的合作著作《博弈論與經濟行為》標志著現代博弈論的誕生。此后,博弈論在經濟學、政治學、心理學等多個領域得到了廣泛的應用和發展。時間發展階段主要貢獻者關鍵成就1928理論奠基馮·諾依曼提出了極小極大定理1944經濟應用馮·諾依曼&摩根斯坦出版了《博弈論與經濟行為》1950s理論擴展約翰·納什等提出納什均衡的概念1.2博弈論的基本概念博弈論研究的是參與者之間如何通過策略選擇來影響結果。每個參與者都希望通過自己的行動最大化個人收益。參與者、策略集、以及收益函數是構成一個博弈的三大要素。參與者:參與博弈決策過程的個體或團體。策略集:每個參與者可以選擇的一系列行動方案。收益函數:描述了不同策略組合下各參與者的收益情況。1.3博弈論與其他學科的關系博弈論不僅限于經濟學領域,在政治科學中,它被用來分析選舉策略和國際關系;在生物學中,它幫助解釋物種間的競爭與合作;而在計算機科學里,博弈論則用于網絡設計和信息安全等方面的研究。第二章:基本要素2.1參與者、策略和收益博弈論中的每一個博弈都是由多個參與者之間的互動組成。每個參與者都有自己的目標,這些目標通常是通過選擇不同的策略來實現的。而收益則是根據所有參與者的策略組合決定的結果。參與者:可以是個體、組織或國家。策略:參與者可能采取的行為路徑。收益:策略實施后的直接后果或獎勵。2.2零和博弈與非零和博弈根據參與者之間的利益關系,博弈可以分為零和博弈和非零和博弈。在零和博弈中,一個參與者的收益必然意味著另一個參與者的損失,總收益為零。而非零和博弈則允許存在雙贏或多贏的局面。零和博弈:如撲克牌游戲,一方所得即為另一方所失。非零和博弈:如國際貿易,雙方可以通過合作獲得比單獨行動更高的收益。2.3納什均衡的定義與示例納什均衡是指在一個博弈中,當所有其他參與者的策略已知時,沒有任何一個參與者能夠通過單方面改變自己的策略而增加自己的收益。這種狀態代表了一種穩定點,在這個點上沒有激勵去偏離當前的策略。示例:兩個公司A和B同時決定廣告預算。如果A增加預算而B保持不變,則A可能會吸引更多的客戶。但如果兩方都增加預算,他們將平分市場,但成本更高。在這種情況下,雙方都不改變預算的策略就構成了一個納什均衡。第三章:完全信息靜態博弈3.1完全信息靜態博弈的特點在完全信息靜態博弈中,所有參與者都知道其他參與者的策略集和收益函數,并且所有參與者同時做出決策。這意味著沒有參與者能夠在做決策之前觀察到他人的選擇。特點:所有信息公開透明。決策是同時進行的。3.2支配策略與納什均衡的求解方法支配策略指的是無論其他參與者采取何種策略,某一特定策略總是優于其他策略的選擇。通過尋找支配策略,可以簡化博弈分析過程,有時甚至可以直接找到納什均衡。方法:尋找支配策略。分析剩余策略組合以確定納什均衡。3.3經典案例分析考慮“囚徒困境”這一經典案例。兩名犯罪嫌疑人被捕后分別關押,并被告知如果一方認罪而另一方不認罪,則認罪者將被釋放,而不認罪者將被判重刑。如果兩人都認罪,則兩人均被判輕刑;若兩人都不認罪,則因證據不足只能判處輕微處罰。結果分析:從個人理性角度看,認罪是最優選擇。然而,集體最優解是兩人都不認罪,這展示了個人理性與集體理性的沖突。第四章:完全信息動態博弈4.1動態博弈中的順序決策過程在完全信息動態博弈中,參與者根據一定的順序做出決策。這種博弈類型允許參與者觀察到之前參與者的行動,并據此調整自己的策略。理解這一過程對于分析復雜的戰略互動至關重要。序貫理性:每個參與者在每一個決策點上都選擇最優反應。信息集:表示參與者在某個決策時刻所知道的所有信息。4.2子博弈完美均衡的定義及計算子博弈是指從一個特定決策節點開始直到博弈結束的一系列可能路徑。**子博弈完美均衡(SPNE)**是一種強化了納什均衡概念的解,要求在整個博弈及其所有子博弈中均達到納什均衡狀態。逆向歸納法:一種用于尋找子博弈完美均衡的方法,從最后階段的決策開始反向推理至初始階段。示例:考慮兩個公司之間的價格戰,通過逆向歸納可以確定在每個決策點上的最佳定價策略。4.3應用實例探討讓我們通過一個具體的例子來說明如何應用上述理論。假設一家新進入市場的公司必須決定是否降低價格以吸引顧客,而現有市場領導者則需要決定是保持當前價格還是降價應對挑戰。情景分析:如果新進入者降價,市場領導者有兩種選擇:降價或不降價。如果市場領導者選擇降價,新進入者的收益將減少;反之亦然。通過逆向歸納法,我們可以預測雙方最有可能采取的策略組合。第五章:不完全信息靜態博弈5.1不完全信息下的博弈特點在不完全信息靜態博弈中,至少有一個參與者不知道其他參與者的全部信息。這增加了博弈的復雜性,因為參與者必須基于不確定的信息做出決策。類型空間:描述每個參與者可能擁有的不同類型,包括他們的偏好、能力等。信念更新:參與者根據對手的行為不斷修正自己對對手類型的估計。5.2貝葉斯納什均衡的概念與解析貝葉斯納什均衡擴展了納什均衡的概念,適用于不完全信息環境。它要求每個參與者在其信念的基礎上選擇最優策略,并且這些策略構成一個納什均衡。概率分布:每個參與者對其對手類型的先驗概率分布的理解。條件策略:給定對手類型時的最佳響應策略。5.3實際問題中的應用以拍賣為例,買家通常只知道商品的大致價值范圍,而不清楚其他競標者的估值。在這種情況下,買家必須根據自己的估值和其他競標者的潛在出價制定策略。密封投標拍賣:每個競標者提交一個報價,最高報價者贏得拍賣品并支付其報價金額。策略選擇:競標者需權衡報高價贏得物品的風險與報低價失去機會的可能性。第六章:不完全信息動態博弈6.1信號傳遞與精煉貝葉斯均衡在不完全信息動態博弈中,參與者可以通過發送信號來影響對方對自己類型的認知。精煉貝葉斯均衡要求參與者不僅要根據對手的歷史行為更新對對手類型的信念,還要在此基礎上選擇最優策略。信號機制:如求職者通過教育水平向雇主傳達工作能力的信息。信念系統:基于接收到的信號調整對對手類型的概率評估。6.2拍賣理論簡介拍賣不僅是經濟學中的一個重要研究領域,也是不完全信息動態博弈的一個典型應用場景。不同的拍賣形式會導致不同的競價行為和結果。公開增價拍賣:所有競標者公開叫價,直至無人愿意再提高出價為止。荷蘭式拍賣:賣家設定起始價,然后逐步降低價格,直到有競標者接受當前價格為止。6.3相關實際案例分析考慮一家公司在招聘高級管理人員時的情況。候選人通過提供簡歷、推薦信等方式向公司展示自己的能力和經驗。公司則依據這些信息決定是否錄用該候選人以及提供的薪資待遇。信息不對稱:候選人的真實能力往往難以直接衡量,公司只能依賴于間接信息進行判斷。激勵相容約束:設計招聘流程使得真正有能力的人更傾向于提供準確的信息,從而增加被選中的幾率。第七章:合作博弈基礎7.1合作博弈的定義與分類合作博弈(CooperativeGameTheory)研究的是參與者之間如何通過協作來實現共同利益。與非合作博弈不同,這里允許參與者形成聯盟并共享收益。轉移支付:在合作博弈中,參與者之間可以進行資源或貨幣的轉移。聯盟形式:根據是否允許轉移支付,合作博弈可分為聯盟博弈和非聯盟博弈。分類描述聯盟博弈允許參與者之間進行轉移支付,通常用特征函數表示每個聯盟的價值非聯盟博弈不允許轉移支付,更注重于分配規則的設計7.2核心概念與穩定集核心(Core)是合作博弈中的一個基本概念,指的是那些無法被任何子聯盟改善其收益的分配方案集合。如果某個分配不在核心內,則意味著存在一個或多個子聯盟能夠通過重組獲得更高的收益。核心穩定性:如果所有可能的子聯盟都不能通過脫離當前聯盟而獲得更多收益,則該分配屬于核心。穩定集:除了核心之外,還有其他形式的穩定分配,如Shapley值、核仁等。7.3分配問題討論在合作博弈中,如何公平地分配總收益是一個關鍵問題。不同的分配方法反映了不同的公平原則和策略考量。Shapley值:基于邊際貢獻的概念,計算每個參與者對聯盟價值的貢獻比例。討價還價解:當兩個或更多參與者就如何分配收益進行談判時,討價還價解提供了一種理論框架。7.4實際應用案例考慮一個簡單的生產團隊,成員們各自擁有不同的技能,共同完成項目后獲得報酬。如何合理分配這筆收入,既能體現每個人的工作量又能保證團隊整體的積極性?分析過程:確定每個成員的邊際貢獻。使用Shapley值計算每個人的應得份額。討論實際操作中的挑戰與調整。第八章:聯盟形成與穩定性8.1聯盟形成的機制與條件聯盟形成是指參與者選擇與其他成員結成聯盟的過程。這一過程受到多種因素的影響,包括信息透明度、信任水平以及預期收益。信息不對稱:當參與者之間的信息不完全透明時,聯盟形成變得更加復雜。信任構建:長期的合作關系有助于增強成員間的信任,促進聯盟的穩定性。8.2夏普利值及其意義夏普利值(ShapleyValue)是衡量每個參與者在聯盟中所做貢獻的一種方法。它確保了分配方案滿足效率性、對稱性和冗余性的要求。計算步驟:列出所有可能的聯盟組合。對每個聯盟計算參與者的邊際貢獻。平均化所有情況下各參與者的邊際貢獻得到最終分配。8.3聯盟穩定性分析聯盟的穩定性取決于其內部結構及外部環境。一個穩定的聯盟應該能夠抵御內外部的干擾,并保持成員的積極性。外部威脅:來自其他潛在聯盟的競爭壓力。內部協調:確保成員間利益分配的公正性,避免因不滿導致聯盟瓦解。8.4應用實例探討以國際氣候協議為例,各國作為獨立參與者,在減排目標設定上需要達成一致意見。然而,由于各國經濟發展階段和技術水平差異,制定統一標準面臨諸多挑戰。解決方案:基于歷史排放量和發展需求制定差異化責任分擔機制。引入激勵措施鼓勵發展中國家積極參與。第九章:演化博弈理論9.1演化穩定策略的概念演化穩定策略(EvolutionarilyStableStrategy,ESS)源自生物學領域,用于解釋物種間的行為模式為何能夠在自然選擇過程中得以維持。ESS定義:如果一種策略在一個群體中占據主導地位,并且新進入者采用任何其他策略都無法成功入侵,則該策略被視為演化穩定策略。9.2生物學和社會科學中的應用盡管起源于生物學,但ESS概念同樣適用于社會科學領域,特別是在理解人類行為和社會規范方面。生物進化模型:如鷹鴿博弈展示了動物在爭奪資源時采取的不同策略。社會規范建立:在某些文化背景下,特定的行為方式成為主流,類似于生物界中的ESS現象。9.3模型構建與分析構建一個有效的演化博弈模型需要明確參與者類型、互動規則及適應度函數等要素。參與者類型:可以是固定的幾種行為模式,也可以隨時間動態變化。互動規則:描述參與者之間如何相互作用,影響彼此的適應度得分。適應度函數:量化每種策略下的相對成功率,決定其在群體中的傳播速度。9.4實際應用案例考慮在線社交網絡中的用戶行為,某些內容分享習慣可能因為帶來更多的關注和支持而逐漸流行起來。這種現象可以通過演化博弈理論加以解釋。案例分析:定義不同類型用戶的特征(如積極分享者、被動瀏覽者)。分析不同策略組合下各類型用戶的適應度變化趨勢。探討何種條件下某種分享習慣會成為社群內的普遍實踐。第十章:博弈論在經濟學中的應用10.1市場結構分析市場結構決定了企業在市場中的行為模式及其競爭策略。不同的市場結構(如完全競爭、壟斷競爭、寡頭壟斷和完全壟斷)影響著企業的定價策略、產量決策及利潤水平。完全競爭:市場上存在大量買家和賣家,任何單一參與者都無法影響市場價格。壟斷競爭:多個廠商提供差異化產品,價格和質量成為競爭的關鍵因素。寡頭壟斷:少數幾家企業控制大部分市場份額,企業間的互動對市場結果至關重要。完全壟斷:單一供應商控制整個市場,能夠決定價格和產量。市場結構特點示例完全競爭大量小規模參與者,自由進出市場農產品市場壟斷競爭差異化產品,一定程度的價格控制餐飲業寡頭壟斷少數大企業主導市場石油行業完全壟斷單一供應商,無替代品公用事業10.2寡頭壟斷模型寡頭壟斷是現代經濟中最常見的市場結構之一。經典的寡頭壟斷模型包括古諾模型、伯特蘭德模型和斯塔克爾伯格模型等。古諾模型:假設所有企業同時選擇產量,目標是在給定競爭對手產量的情況下最大化自身利潤。伯特蘭德模型:企業選擇價格而非產量作為競爭手段,最終導致價格等于邊際成本。斯塔克爾伯格模型:一個領導者先行動,隨后跟隨者根據領導者的決策作出反應。10.3公共物品供給問題公共物品具有非排他性和非競爭性兩大特性,這意味著很難通過市場機制有效提供這些物品。政府通常扮演重要角色來解決這一問題。免費搭車者問題:由于無法排除任何人享受公共物品帶來的好處,個人缺乏為公共物品付費的動力。集體行動困境:當個體利益與集體利益沖突時,如何協調各方達成共識是一個挑戰。第十一章:政治科學中的博弈論11.1投票模式與選舉策略選舉制度設計直接影響到選民的行為以及候選人的競選策略。理解不同投票規則下的激勵機制對于預測選舉結果至關重要。簡單多數制:獲得最多票數的候選人獲勝,可能導致兩黨制格局。比例代表制:政黨根據得票比例分配議席,鼓勵多黨體系的發展。排序投票法:選民按偏好順序排列候選人,旨在更準確反映民意。11.2國際關系中的博弈論分析國際關系中的戰略互動涉及國家間的安全保障、貿易談判等多個方面。博弈論提供了分析這些問題的有效工具。安全困境:一個國家增強軍事力量可能引發其他國家采取類似措施,從而加劇地區緊張局勢。合作博弈:通過簽訂條約或協議實現共同利益最大化,如氣候變化協定。11.3政策制定過程中的戰略互動政策制定不僅涉及到立法機關內部的協商,還受到外部利益集團的影響。各參與方需權衡短期利益與長期目標之間的關系。利益集團游說:特定行業的組織試圖影響政策走向以維護自身權益。公眾意見的作用:媒體和社會運動可以改變公眾態度,進而影響政治決策。11.4實例探討:歐盟的形成與發展歐盟是一個典型的國際合作案例,展示了成員國如何克服分歧,在經濟、法律等領域達成一致。一體化進程:從關稅同盟到貨幣聯盟,逐步深化的合作層次反映了成員國之間信任度的提升。挑戰與機遇:面對全球化帶來的新問題,歐盟需要不斷調整其治理結構以適應變化。第十二章:心理學與行為博弈論12.1行為實驗與有限理性傳統博弈論假設參與者具備完全理性和充分信息,但在現實中,人們的決策往往受到認知偏差和情感因素的影響。前景理論:人們傾向于規避損失而非追求收益,這種心理傾向會影響風險評估。錨定效應:初次接觸的信息會對后續判斷產生過大的影響,即使該信息并不相關。12.2心理因素對博弈結果的影響情緒、個性特征等因素都會對博弈中的人類行為產生顯著影響。了解這些心理機制有助于改進模型預測精度。信任游戲:參與者被要求在沒有直接監督的情況下進行金錢交易,測試他們對陌生人的信任程度。報復心理:遭受不公平對待后,個體會表現出更強的競爭意愿,甚至不惜犧牲自身利益。12.3行為博弈論的應用領域行為博弈論已廣泛應用于金融市場、消費行為研究等多個領域,幫助解釋一些傳統經濟學難以說明的現象。消費者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論