統計學(第二版) 袁衛課件 第11章 統計決策(曾五一)_第1頁
統計學(第二版) 袁衛課件 第11章 統計決策(曾五一)_第2頁
統計學(第二版) 袁衛課件 第11章 統計決策(曾五一)_第3頁
統計學(第二版) 袁衛課件 第11章 統計決策(曾五一)_第4頁
統計學(第二版) 袁衛課件 第11章 統計決策(曾五一)_第5頁
已閱讀5頁,還剩25頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第11章統計決策11.1統計決策的基本概念11.2完全不確定型決策11.3一般風險型決策11.4貝葉斯決策學習目標1. 統計決策的基本概念、基本工具和基本步驟;2. 完全不確定決策的基本準則及其使用場合;3. 風險型決策的基本準則及其應用;4. 貝葉斯決策的概念;5. 后驗概率計算與后驗分析;6. 完全信息價值與補充信息價值的概念及其應用。11.1統計決策的基本概念一、什么是統計決策二、統計決策的基本步驟三、收益矩陣表什么是統計決策狹義的統計決策方法是一種研究非對抗型和非確定型決策問題的科學的定量分析方法。統計決策的基本步驟(一)確定決策目標決策目標是在一定條件制約下,決策者希望達到的結果。反映決策目標的變量,稱為目標變量。(二)擬定備選方案備選方案是決策者可以調控的因素,備選方案中所調控的變量稱為行動變量。所有備選方案的集合稱為行動空間。(三)列出自然狀態自然狀態是指實施行動方案時,可能面臨的客觀條件。所有可能出現的狀態的集合稱為狀態空間,而相應的各種狀態可能出現的概率的集合稱為狀態空間的概率分布。(四)選擇“最佳”或“滿意”的方案(五)實施方案收益矩陣表表11-1收益矩陣表狀態θ1θ2…θn概率P1P2…Pn方案a1q11q12…q1na2q21q22…q2n……………amqm1qm2…qmn收益矩陣的元素qij反映在狀態θj下,采用行動方案ai得到的收益值。這里所說的收益是廣義收益指標。收益是行動方案和自然狀態的函數,可用下式表示:

qij

=Q(ai

,

θj

)i=1,2,…,m;j=1,2,…n11.2完全不確定型決策一、完全不確定型決策的準則二、各種準則的特點和適用場合完全不確定型決策的準則(一)最大的最大收益值準則在決策時,先選出各種狀態下每個方案的最大收益值,然后再從中選擇最大者,并以其相對應的方案作為所要選擇的方案。(二)最大的最小收益值準則在決策時,先選出各種狀態下每個方案的最小收益值,然后再從中選擇最大者,并以其相對應的方案作為所要選擇的方案。(三)最小的最大后悔值準則后悔值是由于決策失誤而造成的最大可能的收益值與實際收益值之差。方案ai在狀態θj下的后悔值,可按下式計算:

rij

maxQ(ai

,θj

)-qij

式中,maxQ(ai

,θj

)是在第j種狀態下,正確決策有可能得到的最大收益,qij是收益矩陣的元素。顯而易見,rij≥0。最小的最大后悔值準則主張:應在求出后悔矩陣的基礎上,先選出各種狀態下每個方案的最大后悔值,然后再從中選擇最小者,并以其相對應的方案作為所要選擇的方案。(四)折衷準則該準則主張根據經驗和判斷確定一個樂觀系數α(0≤α≤1),以α和1-α分別作為最大收益值和最小收益值的權數,計算各方案的期望收益值E(Q(ai))

E(Q(ai))=α{qij

}+(1-α){qij

}

并以期望收益值最大的方案作為所要選擇的方案。(五)等可能性準則該準則假定各種狀態可能出現的概率相同,在此基礎上求各方案收益的期望值,并以期望收益值最大的方案作為所要選擇的方案。各種準則的特點和適用場合最大的最大收益值準則一般只有在客觀情況確實很樂觀,或者即使決策失誤,也完全可以承受損失的場合才采用。最大的最小收益值準適用于對未來的狀態非常沒有把握,或者難以承受決策失誤損失的場合。最小的最大后悔值準則適用于不愿放過較大的獲利機會,同時又對可能出現的損失有一定承受力的場合。折衷準則和等可能性準則都是以各種方案的收益的期望值作為選擇方案的標準。折衷準則事實上是假定未來可能發生的狀態只有兩種:即最理想狀態和最不理想狀態。前者發生的概率是α,后者發生的概率是(1-α)。當α=1時,該準則等價于樂觀準則,而當α=0時,該準則等價于悲觀準則。11.3 一般風險型決策一、然狀態概率分布的估計二、風險型決策的準則三、利用決策樹進行風險型決策自然狀態概率分布的估計客觀概率是一般意義上的概率,通常是由自然狀態的歷史資料推算或按照隨機實驗的結果計算出來的。主觀概率是決策者基于自身的學識和經驗作出的對某一事件發生可能性的主觀判斷。風險型決策的準則(一)期望值準則以各方案收益的期望值的大小為依據,來選擇合適的方案。

E(Q(ai))=(i=1,2,---,m)

式中,E(Q(ai))是i方案的收益的期望值,是i方案在出現j狀態時的收益值;是j狀態出現的概率。(二)變異系數準則在期望值達到一定數額的前提下,以變異系數較低的方案作為所要選擇的方案。方差Var(ai)和變異系數V的計算公式如下:

Var(ai)=E(Q(ai))=(i=1,2,…,m)

Vi=(i=1,2,…,m)(三)最大可能準則 在最可能狀態下,可實現最大收益值的方案為最佳方案。 最大可能準則是將風險條件下的決策問題,簡化為確定條件下的決策問題。只有當最可能狀態的發生概率明顯大于其他狀態時,應用該準則才能取得較好的效果。(四)滿意準則 利用這一準則進行決策,首先要給出一個滿意水平。然后,將各種方案在不同狀態下的收益值與目標值相比較,并以收益值不低于目標值的累積概率為最大的方案作為所要選擇的方案。利用該準則的決策結果,與滿意水平的高低有很大關系。利用決策樹進行風險型決策 決策樹是是一種將決策問題模型化的樹形圖。決策樹由決策點、方案枝、機會點、概率枝和結果點組成。利用決策樹對方案進行比較和選擇,一般采用逆向分析法,即從樹形結構的末端的條件結果開始,從后向前逐步分析。決策樹比較適用于求解復雜的多階段決策問題。圖11-2例11-9的決策樹圖11.4貝葉斯決策一、什么是貝葉斯決策二、貝葉斯公式與后驗概率的估計三、先驗分析與后驗分析四、完全信息價值與補充信息價值五、后驗預分析什么是貝葉斯決策 貝葉斯決策,是利用補充信息根據貝葉斯公式來估計后驗概率,并在此基礎上對備選方案進行評價的一種決策方法。貝葉斯公式與后驗概率的估計 設某種狀態θj的先驗概率為P(θj),通過調查獲得的補充信息為ek,θj

給定時ek的條件概率為,則在給定信息ek的條件下,θj的條件概率即后驗概率可用以下公式計算

先驗分析與后驗分析 先驗分析是利用先驗概率進行決策,而后驗分析是利用后驗概率作為選擇與判斷合適方案的依據。一般來說,只要補充信息是準確的,則后驗分析的結論更為可靠。完全信息價值與補充信息價值 完全信息,是指在對某一問題進行決策時,對于所有可能出現的狀態都可以提供完全確切的情報。完全信息的價值,可以由掌握完全信息前后,所采取的不同行動方案的收益值的差額來表示。用收益值差額的期望值來綜合反映完全信息的價值。其計算公式如下:

EVPI=E[Q(ai,θj

)-

Q(a*,θj

)]

=[Q(ai,θj

)-

Q(a*,θj

)

(11.16)

上式中,EVPI是完全信息價值的期望值,Q(ai,θj

)表示各方案在狀態θj

下的最大收益值,Q(a*,θj

)表示先驗分析中的最佳方案在狀態θj

下的收益值。EVPI越大表明通過收集補充信息使決策效益提高的余地越大。同時,它也代表了為取得該項情報可付出的代價的上限。 補充信息ek

的價值VAI的計算公式如下:

VAI(ek)=先驗EVPI-后驗EVPI(ek)

(11.17)

上式中,先驗EVPI是根據狀態的先驗概率計算的完全信息價值的期望值,后驗EVPI(ek)是在了解補充信息ek后,利用根據該信息修正的后驗概率計算的完全信息價值的期望值。

VAI(ek)的取值與ek

有關。為了綜合反映補充信息的價值,還需要計算補充信息價值的期望值

EVAI=E[VAI(ek)] ==E[VAI(ek)] = 上式中,P(ek)是ek

出現的概率。

P(ek)= ; (11.19) EVAI是判斷收集補充

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論