數據模型與決策概率分布_第1頁
數據模型與決策概率分布_第2頁
數據模型與決策概率分布_第3頁
數據模型與決策概率分布_第4頁
數據模型與決策概率分布_第5頁
已閱讀5頁,還剩49頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據、模型與決策丁邦俊

第二講離散概率分布離散概率基礎概率第一定律:任何事件的概率都是0和1之間的數.例將一枚均勻的硬幣拋出,觀察是正面向上還是反面向上,由完備性和對稱性,這兩個結果出現的可能性相等,即P(出現正面)=0.5;P(出現反面)=0.5概率:是指不確定的結果出現的可能性。例從一副撲克牌(通常去掉大小猴)中任取一張,取到的是A,這種可能性就是概率。概率第二定律:如果事件A和事件B是互斥的,那么P(A或B)=P(A)+P(B)舉例:從一副撲克牌中隨機抽取一張,記A=“方快10”,B=“K”,那么,事件A和事件B是互斥的,于是P(A或B)=P(A)+P(B)=1/52+4/52=5/52離散概率基礎離散概率基礎概率第三定律:符號A|B表示事件B發生的情況下出現了事件A,則

P(A|B)例:從一副撲克牌中隨機抽取一張,記

A=“該牌是任何花色K”,

B=“該牌是花牌(J、Q、K)”則P(A|B)=P(A∩B)/P(B)=離散概率基礎

中國學生(C)外國學生(I)合計男生(M)251540女生(W)451560合計7030100例一個班級學生情況統計如下,求P(C|M)解:P(C|M)=離散概率基礎

中國學生(C)外國學生(I)合計男生(M)0.250.150.4女生(W)0.450.150.6合計0.700.301這個班學生的概率分布為另解:P(C|M)=離散概率基礎同理,可求P(M|C)=25/70第三定律也可以寫成:或:這就是概率的乘法公式。公式中的符號“∩”也可省去。離散概率基礎概率第四定律:如果A、B是相互獨立的事件P(A|B)=P(A)舉例:從一副撲克牌中隨機抽取一張,記

A=“該牌是一張5”,B=“該牌是梅花”

“AB”=“該牌是梅花5”所以,P(A)=P(A|B)則P(A)=4/52=1/13P(A|B)=P(A和B)/P(B)=離散概率基礎第四定律也可以寫成:或:即:獨立的兩個事件乘積的概率等于概率的乘積。這也叫概率的乘法公式。如何何計計算算決決策策樹樹中中的的概概率率CarolineJanse是一一家家消消費費品品公公司司市市場場銷銷售售經經理理,,她她正正在在考考慮慮是是否否生生產產一一種種無無泡泡沫沫的的新新型型自自動動洗洗碗碗清清潔潔劑劑。。為為了了使使得得該該問問題題簡簡化化,,我我們們假假設設市市場場要要么么是是疲疲軟軟的的,,要要么么是是堅堅挺挺的的。。如如果果市市場場是是堅堅挺挺的的,,那那么么公公司司將將贏贏利利1800萬美美元元,,如如果果市市場場是是疲疲軟軟的的,,那那么么公公司司將將虧虧損損800萬美美元元,,根根據據經經驗驗和和直直覺覺的的綜綜合合考考慮慮,,卡卡羅羅林林估估計計市市場場是是堅堅挺挺的的概概率率為為30%在決決定定是是否否生生產產之之前前,,她她可可以以對對無無泡泡沫沫市市場場進進行行一一項項全全國國性性的的調調查查測測試試,,費費用用將將達達到到240萬美美元元。。這種種市市場場調調查查測測試試不不可可能能完完全全準準確確預預測測新新產產品品市市場場,,也也就就是是說說,,它它可可能能會會誤誤導導新新產產品品市市場場。。過過去去的的這這類類調調查查結結果果表表明明::如如果果市市場場是是疲疲軟軟的的(weakly),那那么么有有10%的可可能能性性測測試試結結果果對對市市場場是是肯肯定定的的(Yes),同同樣樣,,如如果果市市場場是是堅堅挺挺的的(strong),那那么么有有20%的可可能能性性測測試試結結果果對對市市場場是是否否定定的的(No)。卡羅羅林林可可以以決決定定要要么么不不生生產產無無泡泡沫沫產產品品,,要要么么在在決決定定是是否否生生產產之之前前,,進進行行調調查查測測試試;;要要么么不不進進行行調調查查測測試試,,直直接接進進行行生生產產。。利用用第第一一講講的的方方法法,,我我們們對對Caroline問題題構構造造了了如如下下的的決決策策樹樹::ACG不生生產產市場場調調查查測測試試否定定的的調調查查結結果果不生生產產不調調查查,,生生產產市場場堅堅挺挺市場場疲疲軟軟BF生產產不生生產產D生產產市場場堅堅挺挺市場場疲疲軟軟E市場場堅堅挺挺市場場疲疲軟軟0.30.71800-800-240-10401560-10401560-240p1=?p2=?p3=?p4=?p5=?p6=?答案p1=0.310p2=0.690p3=0.774p4=0.226p5=0.087p6=0.913肯定的調調查結果果解:記S=市場堅挺挺,W=市場疲軟軟Y=調查結果果是肯定定的N=調查結果果是否定定的P(W)=1-P(S)=1-0.3=0.7,由已知::P(S)=0.30,P(Y|W)=0.1,P(N|S)=0.20P(Y和W)=P(Y|W)P(W)=0.1*0.7=0.07,P(Y|S)=1-P(N|S)=1-0.20=0.80,P(N|W)=1-P(Y|W)=1-0.10=0.90.P1=0.31P2=0.69P3=P(S|Y)=P(S∩∩Q)/P(Y)=0.24/0.31=0.774P4=P(W|Y)=P(W∩∩Q)/P(Y)=0.07/0.31=0.226P5=P(S|N)=P(S∩∩N)/P(N)=0.06/0.69=0.087P6=P(W|N)=P(W∩∩N)/P(N)=0.63/0.69=0.913

市場堅挺(S)市場疲軟(W)合計市場調查是堅挺的(Y)

0.24

0.070.31市場調查是疲軟的(N)

0.06

0.630.69

合計0.300.701.00ACG不生產市場調查查測試否定的調調查結果果不生產不調查,,生產市場堅挺挺市場疲軟軟BF生產不生產D生產市場疲軟軟E市場堅挺挺市場疲軟軟0.30.71800-800-240-10401560-1040-240p1=0.31p2=0.69P3=0.774p4=0.226P5=0.087p6=0913肯定的調調查結果果1560市場堅挺挺972.4-813.8-240972.4135.84-20135.84Caroline的最佳策策略是::首先選擇擇市場調調查測試試;當市場調調查測試試給出肯肯定的結結果時,,她選擇擇生產;;當市場場調查測測試給出出否定的的結果時時,她選選擇不生生產;這一決策策的EMV是$135.84。隨機變量量及其分分布斯隆學院院的學生生暑期工工作的收收入資料料假定被被收集到到了,去去年的情情況是這這樣的((指第一一年的MBA學生的收收入)::總的工資(12周)獲得此類工資的學生所占百分比$21,6005%$16,80025%$12,00040%$6,00025%$05%隨機變量量及其分分布上面的表表格就是是斯隆學學院的學學生暑期期工作的的周收入入(假設為X)的分布隨機變量量:一個個概率模模型中可可以用數數值表示示一個個不確定定的量。。用大寫寫的字母母X、Y、W等表示如:X=“斯隆學院院的學生生暑期工工作的周周收入”Y=“一個硬幣幣拋2次,出現現的正面面數”W=“上海市明明年7月份的降降雨的毫毫米數””隨機變量量及其分分布隨機變量量的分布布需要指指出其取取值和相相應的概概率,通通常用表表格或函函數表示示表格法::X=Bill參加校園園招聘計計劃的收收入X21600168001200060000Pr0.050.250.400.250.05函數法::設Y=“一個硬幣幣拋2次,出現現的正面面數”,p=拋一次硬硬幣出現現正面的的概率二項分布布每次試驗驗只有兩兩個可能能的結果果,即“成功”和“失敗”出現“成功”的概率p對每次試試驗結果果是相同同,進行行n次重復試試驗,出出現“成功”的次數的的概率分分布稱為為二項分分布設X為n次重復試試驗中事事件A出現的次次數,X取x的概率為為二項分布布(Excel)計算二項項分布的的函數是是BINOMDIST(k,n,p,cumulative),它有兩種種形式例生產產過程的的質量控控制假如一個個生產過過程的產產品為合合格品的的概率是是0.83,為廢品品的概率率是0.17,現在假假設生產產5個這樣的的產品,,求其中中至少有有一個是是廢品的的概率。。解p=二項分布布的應用用案例分析析:航空空公司機機票超售售問題整概率分分布的體體指標平均值方差與標標準差概率分布布的整體體指標平均值::也稱期期望,定定義為隨隨機變量量的取值值與相應應的概率率相乘,,再將所所有乘積積求和的的結果,,公式是是:例:X=Bill參加校園園招聘計計劃的收收入X21600168001200060000Pr0.050.250.400.250.05這個數字字含義非非常清楚楚,它就是Bill能夠獲得得期望收收入期望值與與輪盤賭賭長期來看看,莊家家必贏概率分布布的整體體指標方差:定定義為隨隨機變量量與其期期望偏差差的平方方的期望望公式是是:例:X=Bill參加校園園招聘計計劃的收收入X21600168001200060000Pr0.050.250.400.250.05這個數字字特別大大,其單單位是平平方美元,與X的單位不不一致,,它的算算術平方根是3458.60美元,與與X的單位一一致,人們更喜喜歡使用用,并稱稱它為標標準差隨機變量量的線性性函數考慮到Bill參加校園園招聘計計劃有一一定的成成本(與與接收John的機會相相比,有有時間成成本),,假如該該成本是是600美元,那那么Bill暑期打工工12周的實際際收入R1為:R1=X-600如果換成成月收入入,那么么Bill暑期打工工每月的的實際收收入R2為R2=?R1=?X-200,這是隨隨機變量量X的線性函函數隨機變量量的線性性函數我們可以以求出R2的分布::R12100016200114005600-600Pr0.050.250.400.250.05R17000540038001866-200Pr0.050.250.400.250.05我們也可可以求出出R1的分布::有了R1的分布,,我們自自然能夠夠求出R1的期望和和標準差差,并且且可以用用下面的的簡化公公式。隨機變量量的線性性函數例R1的期望和和標準差差分別是是:協方差與與相關性性實例:太太陽鏡和和雨傘的的銷售量量概率pi太陽鏡的銷售量xi雨傘的銷售量yi0.135410.1578100.058100.130130.216420.0529220.13510.114260.152110.054623問題:太太陽鏡和和雨傘的的銷售量量之間有有關系系嗎?協方差與與相關性性X與Y的相關性性定義為為其中分子子COV(X,Y)叫做X與Y的協方差差,定義義為例太陽陽鏡的銷銷售量與與雨傘的的銷售量量的相關關性為::聯合概率率分布與與獨立性性兩個事件件A與B的獨立性性是指P(AB)=P(A)P(B)考慮隨機機變量((X,Y)的概率率,記((X,Y)的取值值為(xi,yi),相應應的概率率為pi,將它們們列出一一個表,,就是((X,Y)的聯合合分布例記記X=“拋一枚枚均勻硬硬幣出現現的正面面數”Y=“拋一枚枚均勻硬硬幣出現現的正面面數減去去反面數數”則X可能的取取值是0、1;Y的可能取取值是-1,1聯合概率率分布與與獨立性性X與Y的聯合分分布為::XY-11010.500.50合計合計0.50.510.50.5聯合概率率分布與與獨立性性兩個變量量相互獨獨立,當當且僅當當對所有x、y都是成立立的。例((1)上面拋拋硬幣的的例子中中,X與Y獨立。(2)太陽鏡鏡的銷售售量與雨雨傘的銷銷售量不不獨立。。您能驗證證一下嗎嗎?提示:((1)需要寫寫出四個個式子驗驗證。(2)只要找找到一個個式子不不成立即即可。P(X=35,Y=1)=0.1,P(X=35)=0.2,P(Y=1)=0.1不相關就就是指沒沒有任何何關系,,比如兩個個股票,,一個漲漲跌不影響另一一個漲跌跌。兩個隨機機變量的的和在投資市市場里,,通常要要考慮資資產組合合配置,,這就涉涉及到隨隨機變量量和的概概念,最最簡單的的情況是是兩個隨隨機變量量之和假設X、Y是兩個隨隨機變量量,Z=aX+bY,其中a、b是已知常常數,那那么從該表達達式可以以看出::(1)若COV(X,Y)>0,則Var(aX+bY)>a2Var(X)+b2Var(Y)(2)若COV(X,Y)>0,則Var(aX+bY)<a2Var(X)+b2Var(Y)由此可見見,選擇擇負相關關的兩個個資產組組合投資資,可以以降低風風險。見見P91案例兩個隨機機變量的的和例假假設AB兩個資產產的投資資收益率率分別為為8%和15%,方差分分別是100元和400元,且它它們的協協方差為為-150,現在將將1萬元投資資AB兩個資產產,求最最佳分配配比例。。解設設投資資資產A、B的比例分分別為x、1-x,則資產產組合的的方差為為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論