




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
對策與決策模型對策與決策模型對策與決策是人們生活和工作中經常會遇到的擇優活動。人們在處理一個問題時,往往會面臨幾種情況,同時又存在幾種可行方案可供選擇,要求根據自己的行動目的選定一種方案,以期獲得最佳的結果。有時,人們面臨的問題具有競爭性質,如商業上的競爭、體育中的比賽和軍事行動、政治派別的斗爭等等。這時競爭雙方或各方都要發揮自己的優勢,使己方獲得最好結果。因而雙方或各方都要根據不同情況、不同對手做出自己的決擇,此時的決策稱為對策。在有些情況下,如果我們把可能出現的若干種情況也看作是競爭對手可采取的幾種策略,那么也可以把決策問題當作對策問題來求解。對策問題對策問題的特征是參與者為利益相互沖突的各方,其結局不取決于其中任意一方的努力而是各方所采取的策略的綜合結果。先考察幾個實際例子。
例1
(田忌賽馬)
田忌賽馬是大多數人都熟知的故事,傳說戰國時期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個等級的馬各一匹進行比賽,每局賭金為一千金。齊王同等級的馬均比田忌的馬略勝一籌,似乎必勝無疑。田忌的朋友孫臏給他出了一個主意,讓他用下等馬比齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬,結果田忌二勝一敗,反而贏了一千金。
例2
(石頭—剪子—布)這是一個大多數人小時候都玩過的游戲。游戲雙方只能選石頭、剪子、布中的一種,石頭贏剪子,剪子贏布,而布又贏石頭,贏者得一分,輸者失一分,雙方相同時不得分,見下表。表1石頭剪子布石頭01-1剪子-101布1-10例3
(囚犯的困惑)警察同時逮捕了兩人并分開關押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒有找到充分證據,希望他們能自己供認,這兩個人都知道:如果他們雙方都不供認,將被以使用和持有大量偽幣罪被各判刑18個月;如果雙方都供認偽造了錢幣,將各被判刑3年;如果一方供認另一方不供認,則供認方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:表2嫌疑犯B供認不供認嫌疑犯A供認不供認(3,3)(0,7)(7,0)(1.5,1.5)表中每對數字表示嫌疑犯A、B被判刑的年數。如果兩名疑犯均擔心對方供認并希望受到最輕的懲罰,最保險的辦法自然是承認制造了偽幣。一、對策的基本要素(1)局中人。參加決策的各方被稱為決策問題的局中人,一個決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭等),也可以包含多于兩名局中人(如大多數商業中的競爭、政治派別間的斗爭)。局中人必須要擁用可供其選擇并影響最終結局的策略,在例3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態度,警方不能為他們做出選擇。從這些簡單實例中可以看出對策現象中包含的幾個基本要素。(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對策問題中,對應于每一局中人存在著一個策略集合,而每一策略集合中至少要有兩個策略,否則該局中人可從此對策問題中刪去,因為對他來講,不存在選擇策略的余地。應當注意的是,所謂策略是指在整個競爭過程中對付他方的完整方法,并非指競爭過程中某步所采取的具體局部辦法。例如下棋中的某步只能看作一個完整策略的組成部分,而不能看成一個完整的策略。當然,有時可將它看成一個多階段對策中的子對策。策略集合可以是有限集也可以是無限集。策略集為有限集時稱為有限對策,否則稱為無限對策。
記局中人i的策略集合為Si。當對策問題各方都從各自的策略集合中選定了一個策略后,各方采取的策略全體可用一矢量S表示,稱之為一個純局勢(簡稱局勢)。
例如,若一對策中包含A、B兩名局中人,其策略集合分別為SA
={1,…,m},SB
={1,…,n}。若A選擇策略i而B選策略j,則(i,j)就構成此對策的一個純局勢。顯然,SA與SB一共可構成m×n個純局勢,它們構成表。對策問題的全體純局勢構成的集合S稱為此對策問題的局勢集合。
(m,n)
…(m,j)
…(m,2)
(m,1)
m…………………(i,n)
…(i,j)
…(i,2)
(i,1)
i…………………(2,n)
…(2,j)
…(2,2)
(2,1)
2(1,n)
…(1,j)
…(1,2)
(1,1)
1A的策略n…J…21B的策略(3)贏得函數(或稱支付函數)。對策的結果用矢量表示,稱之為贏得函數。贏得函數F為定義在局勢集合S上的矢值函數,對于S中的每一純局勢S,F(S)指出了每一局中人在此對策結果下應贏得(或支付)的值。綜上所述,一個對策模型由局中人、策略集合和贏得函數三部分組成。記局中人集合為I={1,…,k},對每一i∈I,有一策略集合Si,當I中每一局中人i選定策略后得一個局勢s;將s代入贏得函數F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢s下局中人i的贏得(或支付)。只討論兩名局中人的對策問題,即兩人對策,其結果可以推廣到一般的對策模型中去。對于只有兩名局中人的對策問題,其局勢集合和贏得函數均可用表格表示。零和對策存在一類特殊的對策問題。在這類對策中,當純局勢確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣
表示若A選取策略i而B選取策略j,則A之所得為aij(當aij<0時為支付)。在有些兩人對策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數之和為一常數。例如在表4中,無論A、B怎樣選取策略,雙方贏得總和均為10,此時,若將各人贏得數減去兩人的平均贏得數,即可將贏得表化為零和贏得表。表4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)
3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)給定一個兩人對策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當遇到零和對策或可轉化為零和對策的問題時,R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對策G又可稱為矩陣對策并可簡記成G={SA,SB,R}例4
給定G={SA,SB,R},其中SA
={1,2,3},SB
={1,2,3,4}
從R中可以看出,若A希望獲得最大贏利30,需采取策略1,但此時若B取策略4,A非但得不到30,反而會失去22。為了穩妥,雙方都應考慮到對方有使自己損失最大的動機,在最壞的可能中爭取最好的結果。局中人A采取策略1、2、3時,最壞的贏得結果分別為min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能為max{-22,2,-10}=2。如果A采取策略2,無論B采取什么策略,A的贏得均不會少于2.B采取各方案的最大損失為max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。當B采取策略2時,其損失不會超過2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時,只要對方不改變策略,任一局中人都不可能通過變換策略來增大贏得或減小損失,稱這樣的局勢為對策的一個穩定點或穩定解,(注:也被稱為鞍點)定義1
對于兩人對策G={SA,SB,R},若有,則稱G具有穩定解,并稱VG為對策G的值。若純局勢()使得,則稱()為對策G的鞍點或穩定解,贏得矩陣中與()相對應的元素
稱為贏得矩陣的鞍點,與分別稱為局中人A與B的最優策略。設A方用概率xi選用策略i,B方用概率yj選用策略j,,且雙方每次選用什么策略是隨機的,不能讓對方看出規律,SA:策略α1,…,αmSB:策略β1,…,βn概率x1,…,xm概率y1,…,yn分別稱SA與SB為A方和B方的混合策略。注:例5A有兩架飛機,B有四個導彈連分別掩護通向目標的四條線路。如飛機沿一條路線進攻,則掩護該線路的導彈連必擊落一架飛機,不過由于重裝導彈時間很長,所以僅僅能擊落一架飛機;如飛機突防進而摧毀目標,A的贏得為1;否則A的贏得為0。現在需要為A、B雙方選擇最優策略。
解:雙方可選擇的策略集分別為A的策略為B的策略為:飛機從不同的路線進入。:飛機從同一條路線進入。:對每一條路線配備一個連。:對兩條路線各配置兩個連。:對一條路線配兩個連,為另條路線各配一個連。:對一條線路配三個連,對另一條路線配一個連。:對一條路線配四個連。由題意得A的贏得矩陣為易求得可知,不存在純策略。若A的最佳策略為(x,1-x)(x是A選擇的概率。)對于A的贏得是對于A的贏得是對于A的贏得是則A的至少贏得為13/41/25/61/2則解得例
某工程按正常速度施工時,若無壞天氣影響可確保在30天內按期完工。但根據天氣預報,15天后天氣肯定變壞。有40%的可能會出現陰雨天氣而不影響工期,在50%的可能會遇到小風暴而使工期推遲15天,另有10%的可能會遇到大風暴而使工期推遲20天。對于可能出現的情況,考慮兩種方案:(1)提前緊急加班,在15天內完成工程,實施此方案需增加開支18000元。
(2)先按正常速度施工,15天后根據實際出現的天氣狀況再作決策。如遇到陰雨天氣,則維持正常速度,不必支付額外費用。如遇到小風暴,有兩個備選方案:(i)維持正常速度施工,支付工程延期損失費20000元。(ii)采取應急措施。實施此應急措施有三種可能結果:有50%可能減少誤工期1天,支付應急費用和延期損失費共24000元;有30%可能減少誤工期2天,支付應急費用和延期損失費共18000元;有20%可能減少誤工期3天,支付應急費用和延期損失費共12000元。風險型決策問題如遇大風暴,也有兩個方案可供選擇:(i)維持正常速度施工,支付工程延期損失費50000元。(ii)采取應急措施。實施此應急措施也有三種可能結果:有70%可能減少誤工期2天,支付應急費及誤工費共54000元;有20%可能減少誤工期3天,支付應急費及誤工費共46000元;有10%可能減少誤工期4天,支付應急費和誤工費共38000元。根據上述情況,試作出最佳決策使支付的額外費用最少。解:由于未來的天氣狀態未知,但各種天氣狀況出現的概率已知,本例是一個風險型決策問題,所謂的額外費用應理解為期望值。
本例要求作多次決策,工程初期應決定是按正常速度施工還是提前緊急加班。如按正常速度施工,則15天后還需根據天氣狀況再作一次決策,以決定是否采取應急措施,故本例為多階段(兩階段)決策問題。為便于分析和決策,采用決策樹方法。根據題意,作決策樹如圖。圖中,□表示決策點,從它分出的分枝稱為方案分枝,分枝的數目就是方案的個數。○表示機會節點,從它分出的分枝稱為概率分枝,一條概率分枝對應一條自然狀態并標有相應的發生概率。△稱為未梢節點,右邊的數字表示相應的收益值或損失值。在決策樹上由右向左計算各機會節點處的期望值,并將結果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 采伐木材協議書
- 分手有孩子協議書
- 貿易技術協議書
- 2025解除合伙協議合同范本
- 拆遷安置補償居間協議書
- 票據委托質押協議書
- 藝考生安全協議書
- 物流司機送貨協議書
- 父母和兒子換房協議書
- 閣樓攝影轉讓協議書
- 《痤瘡與抗痤瘡藥》課件
- 銀行員工反洗錢知識培訓
- 電瓶車以租代購協議書范文范本
- 2024秋期國家開放大學本科《中國法律史》一平臺在線形考(第一至三次平時作業)試題及答案
- 工業化國家的社會變化 統編版九年級歷史下冊
- 人教版初中九年級全冊英語單詞表(完整版)
- 蘇教版五年級上冊數學簡易方程練習100道及答案
- 浙江省衢州市(2024年-2025年小學三年級語文)人教版期末考試(下學期)試卷(含答案)
- 廣東省佛山市華英學校2023-2024學年上學期七年級入學分班考試英語試卷
- 第一單元名著導讀《艾青詩選》作業設計-部編版語文九年級上冊
- 《財務大數據分析高職》全套教學課件
評論
0/150
提交評論