




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章隨機變量及其分布一本章的教學目標及基本要求(1)理解隨機變量的概念,理解隨機變量分布函數的概念及性質,理解離散型和連續型隨機變量的概率分布及其性質,會運用概率分布計算各種隨機事件的概率;(2)熟記兩點分布、二項分布、泊松分布、正態分布、均勻分布和指數分布的分布律或密度函數及性質;二本章的教學內容隨機變量離散型隨機變量及其分布離散隨機變量及分布律、分布律的特征常用的離散型隨機變量常見分布(0-1分布、二項分布、泊松分布)隨機變量的分布函數分布函數的定義和基本性質,公式連續型隨機變量及其分布連續隨機變量及密度函數、密度函數的性質常用的連續型隨機變量常見分布(均勻分布、指數分布、正態分布)及概
2、率計算三本章教學內容的重點和難點a)隨機變量的定義、分布函數及性質;b)離散型、連續型隨機變量及其分布律或密度函數,如何用分布律或密度函數求任何事件的概率;c)六個常見分布(二項分布、泊松分布、幾何分布、均勻分布、指數分布、正態分布);四教學過程中應注意的問題a)注意分布函數F(x)PXx的特殊值及左連續性概念的理解;b)構成離散隨機變量X的分布律的條件,它與分布函數F(x)之間的關系;c)構成連續隨機變量X的密度函數的條件,它與分布函數F(x)之間的關系;d)連續型隨機變量的分布函數F(x)關于x處處連續,且P(Xx)0,其中x為任意實數,同時說明了P(A)0不能推導A。e)注意正態分布的標
3、準化以及計算查表問題;五思考題和習題思考題:1.函數ex,x0F(x)1ex,x0是否是某個隨機變量的分布函數?2.分布函數F(x)有兩種定義PXxorPXx,主要的區別是什么?3.均勻分布與幾何概率有何聯系?4.討論指數分布與泊松分布之間的關系。5列舉正態分布的應用。2.1隨機變量與分布函數一、隨機變量的概念一般來說一個隨機試驗的結果可以分為兩種類型。例2-1一次晚會組織抽獎,獎勵以獎金形式發放。已知一等獎有一個名額,獎金額度500元;二等獎有三個名額,獎金額度100元;三等獎有5個名額,獎金額度50元;紀念獎10個名額,獎金額度10元。則此時抽獎活動可以看做是一個隨機試驗,作為獲獎金額的樣
4、本點是以具體數值形式出現的。例2-2學校體育課有籃球、網球、羽毛球、排球和瑜伽五個項目供同學選擇。選擇方法是首選自主,若該項目名額已滿則系統隨機將未入選學生安排至另外報名未滿的項目。某學生首選羽毛球,結果學員已滿。此時第二次選擇可以看做一次隨機試驗,所有可能的結果為籃球班、網球班、排球班和瑜伽班,此時樣本點不再是以具體數值出現。例2-1中的樣本點本身是以具體數量的形式出現的,稱為數量型。我們很方便的可以將樣本點對應到其具體的數值上,從而得到一個由樣本空間到實數的函數X:X(),其中的X()即樣本點的取值。例2-2中的樣本點并不是以數量形式出現,我們稱為非數量型。類似數量型當我們將籃球班、網球班
5、、排球班和瑜伽班四個班分別以數字1,2,3,4表示時,我們也得到了由樣本空間到實數的一個函數.此時樣本空間中的每一個樣本點作為函數的自變量,對應到的具體數值即為函數的取值。由樣本點的隨機性這樣的函數X取值變化也具有隨機性,是一個隨機變化的變量,我們稱之為隨機變量。定義2-1設為隨機試驗E的樣本空間,若對中的每個樣本點,都有唯一的實數X()與之對應,則稱函數:X:R,X:X()為定義在樣本空間上的一個隨機變量。一般用大寫字母X,Y,Z;或者希臘字母,表示。X的函數值稱為隨機變量的取值,記為x,y,z等。例2-3小明去布吉島探險,不幸落入食人族手中。食人族族長與小明約定由小明擲骰子決定他的生死。若
6、點數為1、2(?。?,則小明成為食人族部落當晚的夜宵;若點數為5、6(大),則可以給小明自由;若點數為3、4(中),則將小明關押起來等第二天再投骰子決定。此時隨機試驗為小明擲骰子觀測結果,樣本空間為1,2,3,4,5,6.若記1為生,1為死,0為生死未卜。則可得一隨機變量X:R,X:X(),其中X(1)X(2)1,X(3)X(4)0,X(5)X(6)1.隨機變量的取值為x1,1x0,x1.23這里我們看到樣本點和隨機變量X的取值雖然都是數字,但它們并不相等。例2-4一根樹枝長度為兩米,某人用一把刀隨機地將樹枝砍成兩段?,F在考慮較短的一段長度,則其樣本空間為0,1.這是一個數量型樣本空間,我們將樣
7、本空間中每個樣本點對應到它的數量就得到了一個隨機變量X:R,X:X(),其中X().這里的樣本點個數有不可列個,同樣隨機變量的取值也有不可列個。在第三節我們會詳細討論這樣的隨機變量。例2-5為調查某產品的市場推廣情況,調查小組隨機地在消費者中選取了1000名志愿者進行問卷調查。調查內容分為有關志愿者的個人情況如年齡、性別,是否使用過本產品,以及滿意度等等。此時隨機試驗的樣本空間為全部1000名志愿者。0若記男性為1,女性為0則可得到一隨機變量X:R,X:X().其中111X()i,當為男性,i1;當為女性,i0。若將每個樣本點對應到志愿者的年1齡則得到另一隨機變量X:R,X:X().其中X()
8、為志愿者的年齡;若2222將志愿者使用過該產品記為1,未使用過記為0.則得到第三個隨機變量X:R,31X:X(),其中X();若將志愿者對產品的滿意程度對應到1,1的每個實333數,越大表示越滿意,0表示未使用過,則同樣得到一個隨機變量X:R,4X:X(),其中X()的所有可能取值為1,1.444由上面的例子可以看出,對應于同一個樣本空間,進行不同的隨機試驗就得到了不同的隨機變量,它們反映了同一個個體不同方面的屬性。這也是利用隨機變量研究隨機現象的一個優勢。類似集合表示的形式,對于具體的隨機事件我們可以將第一章中有關事件及其關系運算的內容表示為隨機變量取值的形式如:一般的隨機事件A可對應表示為
9、:XD;單樣1本點概率P()可表示為:PXx,其中X()x;若記DX()|A,1DX()|B則:事件概率P(A)可表示為:PXD;積事件概率P(AB)可表21示為:PXD,XD;和事件概率P(AB)為:P(XD)(XD);條件概1212率P(A|B)可表示為:PXD|XD.類似地,讀者可以自己將第一章中概率的性質12及條件概率的三大公式表示為隨機變量形式。二、隨機變量的分布函數隨機變量只能反映樣本點和其取值之間的對應關系,并不能反映隨機事件的概率性質,因此我們還需要利用函數工具給出隨機變量和其概率性質之間的關系。我們稱反映這樣對應關系的函數為隨機變量的概率分布函數。注意,分布函數是反映隨機變量
10、不同取值對應的概率性質,因此其自變量是隨機變量取值,而因變量則是對應的某個隨機事件的概率值。因此,我們定義分布函數如下:定義2-2設X為隨機變量,對任意的xR,稱函數F(x)PXx,x為隨機變量X的分布函數,記為XF(x).如圖所示,分布函數表示隨機變量X取值不超過x的概率。圖2-1分布函數的意義由分布函數的定義不難得到分布函數具有下列性質:性質若F(x)為隨機變量X的分布函數,則(1)有界性:0F(x)1,xR;(2)單調不減性:xxF(x)F(x);1212(3)F()0,F()1;(4)右連續性:F(x)F(x0),xR.證明略。分布函數一定滿足以上四條性質。反之,可以證明滿足以上四條性
11、質的函數,可以看做某個隨機變量的分布函數。利用分布函數我們很容易求出隨機事件的概率。一般地有:(1)PaXbF(b)F(a);(2)PXa1F(a);(3)PaXbF(b)F(a0);12041例2-6隨機變量X的分布函數為F(x)2x1x11x00 x1,求以下事件概率:1x2x2P0.5X1.5,PX0.5,P0X3,PX1.解P0.5X1.5F(1.5)F(0.5)1.511,224PX0.51F(0.5)111,2213P0X3F(3)F(00)1,4411PX1P1X1F(1)F(10)022.例2-7隨機變量X的分布函數為F(x)ABarctanx,求常數A,B.解由分布函數的性質
12、有,F()ABarctan()A2B0,F()ABarctan()A2B1,故:A121,B.例2-8F(x)是否可以作為某個隨機變量的分布函數?(1)x;2)1(1x2(x0,其他場合適當定義;3)0 x,其他場合適當定義。解(1)當x時,由于F()0,但F()01因此F(x)11x2不可以作為某個隨機變量的分布函數;(2)當x0時,F()0,F(00)1,故只需定義F*(x)1x211x0 x0,容易驗證F*(x)滿足分布函數的四條基本性質,因此F*(x)可以作為某個隨機變量的分布函數。(3)當0 x時,F()01,因此F(x)不能作為某個隨機變量的分布函數。注意我們現在涉及到與隨機試驗有
13、關的兩個函數:隨機變量和隨機變量的分布函數,它們之間有聯系也有區別。隨機變量是由樣本點對應到其取值用一個數字反映觀測對象的某方面屬性的,其自變量是樣本點而函數值是實數;而分布函數則反映隨機變量取值的概率分布情況的,其自變量是隨機變量的取值而函數值是樣本點對應的概率,因此取值范圍只能是0,1.隨機變量X取值為x時所對應的樣本點與分布函數F(x)在x點所對應的樣本點是一致的。對于一些特殊的隨機變量,除了分布函數可以完整描述其概率分布外,還可以采用其他的工具來處理。隨機變量按照處理工具不同可分為:離散型取值有限或者至多可列如例2-3.這類隨機變量可以采用用列表法將其取值概率一一列舉;連續型取值不可數
14、但事件概率可看作是某個函數積分如例2-4,這類隨機變量可以采用解析法求積分處理;除了這兩類以外稱為奇異型隨機變量,這類隨機變量在實際中出現相對較少,只能采用分布函數法處理。在后續章節中我們主要討論離散型和連續型兩類隨機變量。2.2離散型隨機變量一、離散型隨機變量的概率分布定義2-3取值有限或可列的隨機變量X稱為離散型隨機變量。因為離散型隨機變量的取值為有限或可列,因此我們可以將其取值一一列舉出來,而把對應的概率列舉在取值下方而形成列表的形式。我們稱這樣的列表為離散型隨機變量的分布列。將列表表示為函數的形式稱為離散型隨機變量的概率分布。定義2-4設X為離散型隨機變量,其取值為x,i1,2,.,n
15、,.,則稱PXxpiii為X的概率分布;而稱Xx1x2.xn.Pp1p2.pn.為X的分布列。例2-9小紅帽帶糕點去奶奶家。行至岔路口有三條支路,已知其中只有一條通往奶奶1家。若將小紅帽可以到達奶奶家記為1,不可到達記為0,則可得取值為0、的隨機變量X,其分布列為:X012/3P1/3例2-10設某大型網絡游戲中一件極品裝備在某副本中爆出的幾率為0.00001,有游戲玩家為獲得該裝備決定去刷能爆出該裝備的游戲副本。若用X表示該游戲玩家在刷出裝備(1)p1;前進入游戲副本的次數,則顯然X的可能取值為0,1,2,3,.,n,.;概率分布為:PXi(10.00001)i0.000010.99999i
16、0.00001,i0,1,2,.,n,.離散型隨機變量的分布列具有以下性質:性質ii1(2)0p1,i1,2,.,n,.i離散型隨機變量的概率分布一定滿足以上兩個性質,反之,滿足以上兩條性質的數列,一定可以作為某離散型隨機變量的概率分布。例2-11離散型隨機變量X的概率分布如下:(1)PXia(2)i,i1,2,3;32(2)PXia()i,i1,2,3,3.求未知量a.2解注意到(1)中取值為有限個,而()中為可列個。由離散型隨機變量分布列性質:(1)pa()1a()2a()3a()1()2()31,故a.3i1i2222222733333338pa(2)a()i1,故a33(2)iii1i
17、1i1212.由離散型隨機變量的概率分布很容易可以得到一般隨機事件概率的計算公式,事實上PXIpi.xiI例2-12離散型隨機變量X的概率分布如例2.2.3(1),求PX1,PX1,PX2,PX2.5,PX3,PX4.解由于X的概率分布為:PXi27(2)i,i1,2,3,故383PX1=p0,ixi1PX1ppi1xi12729,38319PX2ppi1xi2919,x2.5x2PX2.5ppppii12ii9615191919,PX4pp1.88756PX3pppp1,i123xi3iixi4xi3例2-13袋內有5個黑球,3個白球,每次抽取一個,不放回,直到取得黑球為止。記X為取到白球的
18、數目,求隨機變量X的概率分布。若記Y為抽取的次數,則隨機變量Y的概率分布又如何?解X為取到白球的數目,故其取值為:0,1,2,3.對應概率:5pPX0,03515pPX1=,1876563255pPX2=2,87655632151pPX3=3,故X的分布列為:X0123P5/815/565/561/56Y為抽取的次數,則Y的可能取值為:1,2,3,4.而PY1PX058,3515PY2PX1=,87563255PY3PX2=87656,32151PY4PX3=,876556故Y的分布列為:Y1234P5/815/565/561/56離散型隨機變量概率分布圖像如下,形如一列豎立著的火柴棒。圖2-
19、2離散型隨機變量概率分布二、離散型隨機變量的分布函數對離散型隨機變量來說,我們已經有分布函數和概率分布兩個工具來全面描述其概率特征。那么這兩者之間有什么樣的關系呢?由分布函數的定義,立即可以得到離散型隨機變量X的分布函數為:F(x)PXxpixix而由分布函數的右連續性又可以得到pF(x)F(x0),因此隨機變量X的概率分布iii為PXxpF(x)F(x0).iiii例2-14已知隨機變量X的分布列為X135P0.50.20.3求X的分布函數。解X的取值為1,3,5.當x5時,F(x)PXxppPX5PX3PX11;iixixxi5當3x5時,F(x)PXxpPX1PX30.7;ixix當1x
20、3時,F(x)PXxpPX10.5;ixix當x1時,F(x)PXxp0;ixix故X的分布函數為:0 x1F(x),0.73x50.51x31函數圖像為:5x在由上例可以看出離散型隨機變量的分布函數的圖像為階梯形的分段函數,每個取值點分段,每段均為一條水平線段;其高度差或者說跳躍的幅度為左端點取值的概率大小;由分布函數的右連續性,空心圓始終出現在線段的右端點;最左端與x軸重合,最右端與直線x1重合。0 x10.31x1例2-15設F(x)為某隨機變量X的分布函數,0.71x212x試做出分布函數的圖像,并求X的分布列。解X的分布函數圖像為:分布函數分段點為隨機變量X的取值,故X的取值為:1、
21、1、2;分布函數每段的跳躍幅度即為分段點對應取值的概率,故PX10.3、PX10.70.30.4、PX210.70.3;因此,X的分布列為:X112P0.30.40.3三、常用離散型隨機變量的分布定義2-6如果隨機變量X的概率分布為:,則稱該隨機變量服從PXx1p下面我們介紹幾種常用的離散型隨機變量的分布,請讀者注意它們的實際應用背景或者對應的實際概率模型。1.退化分布定義2-5如果隨機變量X的概率分布為:PXx1,則稱該隨機變量服從退化分0布。其布分布函數為F(x)0 xx0.1xx0若X服從退化分布,X只去常數x,此時可以說X的取值并不隨機,但我們寧可把0它看作隨機變量的極端或退化情況,因
22、此成為退化分布。2.01分布例2-16期貨交易是在指定時間發生(實際交割)前以當前價格買入或賣出某類貨物的金融投資行為。當某投資者認為該貨物在指定交割時間價格要高于當前價格則會考慮此時買入,從而等到指定交割時間到來時賣出以獲得收益。稱為做多。反之若投資者認為該貨物在在指定交割時間價格要低于當前價格則會考慮將手中的貨物按照當前價格拋出,實際交割時間時賺取利潤。稱為做空。設某投資者判斷正確則可獲利5000元,錯誤則損失3000元。則可得一隨機變量取值為5000和3000。因其取值只有兩個,我們稱之為兩點分布。PXxp12參數為p的兩點分布,不妨設xx,則其分布函數為:F(x)p112特別地,如果x
23、0和x1,即X的概率分布可表示為120 xx1xxx.12xx2PX11pPX0p,則稱隨機變量X服從參數為p的01分布。其分布函數為F(x)p0 x1.1x10 x0第一章中我們介紹了貝努利試驗,若記試驗成功為1、失敗為0則一次貝努利試驗所對應的隨機變量即為01分布。3.n個點上的均勻分布第一章中我們還介紹了古典概型,其樣本點有限且等概率。表示成隨機變量即可得到:定義2-7如果隨機變量X的概率分布為:PXxi1n,i1,2,.,n,則稱該隨機變量服從n個點x,x,x上的均勻分布。12n之所以稱其為n個點上的均勻分布,是因為隨后在連續型隨機變量中我們會遇到均勻分布。那時候我們會發現n個點上的均
24、勻分布實際上是對連續均勻分布的離散化。4.二項分布在n重貝努利試驗中考慮事件A發生的次數X,則X的所有可能取值為0,1,n,由第一章定理1-3,試驗恰好成功k次的概率為Ckpk(1p)nk.n定義2-8如果隨機變量X的概率分布為:PXkCkpk(1p)nk,k0,1,.,n;n則稱該隨機變量服從參數為n,p的二項分布,記為XB(n,p),并將第k項概率分布值記為PXkCkpk(1p)nkb(k;n,p).其分布列為nX01.k.nP.Ckpk(1p)nk.(1p)nnp(1p)n1pnn由二項定理不難驗證,定義2.2.6給出的概率分布滿足性質2.2.1,請讀者自己驗證。例2-17試判定下列哪些
25、是二項分布,并確定參數。(1)X12.nP.np(1p)n1C2p2(1p)n2pnn(2)X012.nP.C0(1p)0pnn(1p)pn1C2(1p)2pn2(1p)nnn(3)X012.nPCn(1p)nCn1p(1p)n1Cn2p2(1p)n2nnn.C0pnn解(1)不是,取值不是從0開始。(2)是,根據定義服從B(n,1p).(3)是,因為CnkCk,故服從B(n,p).nn由上面例子可以看出,參數p和1p在二項分布中地位是對等的,且組合系數CkCnk,于是我們有如下定理:nn定理2-1若XB(n,p),記YnX,則YB(n,1p).定理的意義如下表示。證明較簡單,留給讀者自己練習
26、。YnXnn1.nk.0X01.k.nP(1p)nCkpk(1p)nknp(1p)n1.npnPX6Ck0.8k0.210kYb(10,0.2),PX6PY4Ck0.2k0.810k0.97.例2-18對某種藥物的療效進行研究,假設這種藥物對某種疾病的治愈率p0.8,現對10名患者進行試驗,求患者同時服藥后至少有6人治愈的概率。解設10名患者中治愈的人數為隨機變量X,則XB(10,0.8),于是有1010k6由于參數p0.8較大,故可以考慮利用定理2.2.1轉化為YnX處理。410k0例2-19某大學的校網球隊與該校某系網球隊舉行對抗賽。一般地,校隊實力略高于系隊,每個校隊隊員獲勝概率為p0.
27、55.現雙方商討對抗賽的比賽方式,提出以下三種備選方案:(1)雙方各出3人;(2)雙方各出5人;(1)雙方各出7人。勝出人數多的一方獲最終勝利。問系隊如何選擇較為有利?解設系隊獲勝隊員人數X為,系隊隊員獲勝概率為p0.45,一般可認為隊員間的比賽相互獨立,則X服從二項分布。分別計算三種方案的獲勝概率:(1)PX2C3k30.45k0.553k0.425;(1)PX3Ck0.45k0.555k0.406;k255k3C(1)PX47k70.45k0.557k0.391;k4由此可知,第一種方案對系隊最為有利。這也比較容易理解,因為參賽的隊員人數越少,偶然性越大,系隊僥幸獲勝的概率也就越大。顯然雙
28、方若都只出一人比賽則系隊獲勝概率達到最大為p0.45.5.幾何分布在貝努利試驗序列中,考慮事件A第一次發生時的試驗次數X,則X的可能取值為1,2,n,取值為k的概率為PXkP(AA.AA)P(A)P(A).P(A)P(A)(1p)k1p,k1k1我們稱這樣的離散型隨機變量服從幾何分布。定義2-9設隨機變量X的概率分布為:PXk(1p)k1p,k1,2,.,n,.,則稱該隨機變量服從參數為p的幾何分布。記為XG(p).PXk(1p)pp(1p)k1p由于k1k1k1k11=1,1(1p)且(1p)k1p0,故幾何分布概率分布滿足離散型隨機變量概率分布的兩條性質。例2-20血庫急需RH陰性血液,需
29、從獻血者中獲得,依據經驗,RH陰性血液出現概率為0.003,今對獻血者進行化驗,用X表示在第一次找到合格的RH陰性血液時,獻血者已經化驗的人數。求已知化驗了5人尚未出現RH陰性血液的概率,以及化驗了10人后再化驗5人仍未出現RH陰性血液的概率。PX5PXk0.0030.99750.985,PX105|X10PX15,X10解依題意有隨機變量XG(0.003),故所求概率分別為:(10.003)51(10.003)k6PX150.985.PX10PX10我們稱上面的性質為幾何分布的無記憶性。它說明幾何分布在之前進行的試驗次數對隨后再進行試驗的次數是沒有影響的。即:性質若隨機變量XG(p),則PX
30、mn|XnPXm,n,m。(1p)證明PXmkm1k1(1p)mpp(1p)m,1(1p)PXmn|XnPXmn,XnPXnPXmn(1p)mn(1p)mPXn(1p)n故PXmn|XnPXm.6.超幾何分布某學校有1000名學生,其中900男生、100女生,現學校隨機選取10名同學參加一項公益活動,其中男生的人數恰好為8名的概率應如何計算?上例中我們需要對一類總體進行不放回的抽樣。一般地若有NNN個個體構成的12總體,N個具有性質A,N個不具有性質A,不放回抽取n個,其中具有性質A的個體12數目就構成了一個隨機變量,這樣的隨機變量分布稱為服從超幾何分布。定義2.2.8如果隨機變量X的概率分布
31、為:PXkCkCnkN1N2CnN,k0,1,2,.,n,其中NNN,則稱該隨機變量X服從參數為n,N,N的超幾何分布,記為1212XH(n,N,N).120,利用組合性質CkCnkCn由組合數的非負性顯然PXkCkCnkN1N2CnNnk0N1N2N1N2PXkCCN1Cnk可得:k0k0NnnkCnkN1N2Cn1nCnNk0kN2CnN1N2CnNCnN1,因此超幾何分布CnNk!e,k0,1,2,.,n,.,由指數函數的冪級數展開式exx有,當取x時ex,故滿足離散型隨機變量概率分布的兩條性質。7.泊松分布(XP())定義2-10如果隨機變量X的概率分布為:PXkk0,則稱該隨機變量服
32、從參數為的泊松分布,記為:XP().kk!k!k0k0k!eepXkk0k0k0kkk!ee1k!e0,故泊松分布滿足離散型隨機變量概率分布的且由于0,所以PXkkPX14e100.91660.95,PX16e0.95130.95,兩個性質。泊松分布在排隊問題中有著重要應用。凡是涉及到一段時間內的計數問題,最終都近似服從泊松分布,如單位時間內的電話呼叫數等。由泊松分布的概率分布計算有關事件的概率是比較困難的。經過人們長期努力,通過其他手段得到了泊松分布在不同參數和取值下的分布函數值,并編成了表格形式,稱為泊松分布表。隨后對服從泊松分布的隨機變量概率的計算,我們只需要查表取值就可以了。例2-21
33、某商店根據過去的銷售記錄知道某種商品每月的銷售量可以用參數為10的泊松分布來描述。為了以95%以上的概率保證不脫銷,問商店在月底應存多少件該商品?(只在月底進一次貨)解設X為該商店每月的銷售量,則XP(10),依題意要求,k滿足PXk0.95,查參數為10的泊松分布表有1410ii!i01610i10i!i0因此商店在月底應存15件該商品才能保證以95%以上的概率保證不脫銷。8.超幾何分布、二項分布、泊松分布的關系在超幾何分布中當N非常大而抽樣個數相對較少時,可以近似地將不放回抽樣看作有n放回抽樣,從而超幾何分布近似于二項分布。類似地,當重貝努利試驗次數較大而事件發生概率較小時,則我們可以將其
34、看成近似計數問題而符合泊松分布。由此我們得到以下定理:NN定理2-2(1)若XNH(n,N,N),若limN1p時,則N12limNCkCnkN1N2CknCkpk(1p)nk;nk!e.nN1npn(2)若YB(n,p),若n,np時,則nnnlimCkpk(1p)nkknnn(證明略。)定理2.2.2說明,一列服從超幾何分布的隨機變量,在一定條件下其極限分布為二項分布;而一列服從二項分布的隨機變量,在一定條件下其極限分布為泊松分布。這意味著當N充分大而n相對較小時,我們可以將超幾何分布近似看作二項分布處理;而當n充分大,p相對較小時,我們可以將二項分布近似看作泊松分布處理。即:NB(n,p
35、)nH(n,N,N)P()12pNN1pnpnk!eCkCnkN1N2CkNNnCkpk(1p)nknNk例2-22紡織廠女工照顧800個紡錠,每個紡錠在某一段時間內發生斷頭的概率為0.005(設短時間內只發生一次斷頭)。求在這段時間內總共發生的斷頭次數不超過2的概率。解設X為800個紡錠在該時段內發生的斷頭次數,則XB(800,0.005),顯然n充P分大,而p相對較小,因此可以認為近似服從泊松分布X(4),依題意要求:24kP0X2e40.2381,k!k0即這段時間內總共發生的斷頭次數不超過2的概率為0.2381.例2-23一大袋種子,發芽率為0.9,從中任取出10粒,問播種后恰好有8粒
36、發芽的概率為多少?解設X為發芽種子數,一袋種子總數為N,則X服從超幾何分布C8C2PX80.9N0.1N,C10N由于N充分大,而10相對來說較小,因此X可以近似看成服從二項分布B(10,0.9).即:C10PX8C8C20.9N0.1NC80.980.12,10N由定理2.2.1轉化為隨機變量Y10X的取值概率得:PX8PY2C20.120.980.1839.10這里我們同時得到了在開始介紹超幾何分布時提出的問題的答案,恰好為8名男同學的概率與本題一樣也為0.1839.2.3連續型隨機變量稱本節主要討論非離散型隨機變量中的一種可以利用積分處理的隨機變量,為連續型隨機變量。它是非離散型隨機變量
37、中實際應用最廣泛的一類。一、連續型隨機變量的概率密度函數非負函數f(x)在區間a,b的積分PaXbf(x)dx來計算,則稱該隨機變量為連定義2-11若隨機變量X的取值不可數,但任意事件aXb的概率可以通過一個ba續型隨機變量。我們稱f(x)為該隨機變量的概率密度函數,記為:Xf(x).該定義表明事件aXb發生的概率等于密度函數f(x)在區間a,b上形成曲邊梯形的面積。圖2-3密度函數的幾何意義類似于離散型隨機變量的概率分布,連續型隨機變量的密度函數也具有以下兩條性質:性質密度函數f(x)具有以下性質:(1)f(x)dx1,例2-24設隨機變量X的密度函數為f(x),0其他(2)f(x)0,x.
38、連續型隨機變量密度函數一定滿足前面兩個性質,反之滿足這兩個性質的函數f(x)同樣可以看做是某個連續型隨機變量的密度函數。離散型隨機變量的概率分布取值只能是0p1,而由上面的性質我們立即可以發現i連續型隨機變量的密度函數f(x)是可以大于1的。這是因為概率分布取值表示離散型隨機變量取某一值的概率,而密度函數則表示連續型隨機變量在各點取值的“密集”程度,若f(x)較大,則表明X在鄰域(x,)中取值的概率較大。00當積分上下限相等時積分值為零,因此我們有下列結論:PXaaf(x)dx0a這說明連續型隨機變量在單點上取值的概率恒為0!我們介紹過幾何概型,其每一個樣本點發生的概率均為0,但并不是說樣本點
39、不會出現。這說明概率為0的隨機事件也是有可能發生的,只不過發生的幾率非常的小而已。相對的,不可能事件是一定不會發生,因此其發生概率為零。讀者應注意零概率事件和不可能事件的區別。另外,連續型隨機變量落在某個區間的概率可以不為0,由樣本點和事件之間的關系我們可以發現,無窮個概率為0的樣本點構成的隨機事件其概率會不等于0,這是個有趣的現象。由于單點概率為0,因此一個事件是否包含其區間端點并不影響其概率的大小,即下列事件的概率相等:PaXbPaXbPaXbPaXbbf(x)dxa利用密度函數很容易計算連續型隨機變量落在任意區間的概率,其概率值就是密度函數在該區間上的積分,并且這一區間可以是有限區間,也
40、可以是無窮區間。axb0 x2且P1X30.25,求a和b,并求P1.5X.解由密度函數性質立,有f(x)dx2(axb)dx1,002a2b1,又P1X33f(x)dx2(axb)dx0.25,故a故(x2bx)2211a(x223a12bx)b0.25,聯立求解得:a,b1.122P1.5Xf(x)dx2(x1)dx0.0625.11.51.52例2-25確定常數A,使f(x)成為某個連續型隨機變量的密度函數Ax21x2f(x)Ax02x3.其他解要使得f(x)成為密度函數,則必須有f(x)0,x,因此,A0,又f(x)dx2Ax2dx3Axdx1,故AAA2A1,即A.819612332
41、29二、連續型隨機變量的分布函數隨機變量X的分布函數表示X的取值不超過x的概率,因此F(x)PXxxf(t)dt,由變上限積分求導結論可知在f(x)的所有連續點上,有f(x)(xf(t)dt)F(x).這說明連續型隨機變量的密度函數和分布函數之間是可以相互表示的,和離散型隨機變量類似,連續型隨機變量使用密度函數描述其概率分布情況更為方便。例2-26設f(x)x0A布函數。解由密度函數性質,有0 x1其他為某隨機變量X的密度函數,求常數A和X的分f(x)dx101A1dx=2Ax2A1,故A;x02當x0時,F(x)PXxxf(t)dt0;當0 x1時,F(x)PXxxf(t)dtx102tdt
42、x;當x1時,F(x)PXxxf(t)dt1;故分布函數為:10F(x)xx00 x1.x101(1x)ex例2-27設F(x)x0 x0為連續型隨機變量X的分布函數,求X的密度函數,并求概率PX1.解當x0時,f(x)F(x)=0;當x0時,f(x)F(x)=(1(1x)ex)=xex;xex綜上有:f(x)0 x0 x0;而PX1F(1)12e1.性質X為連續型隨機變量,則X的分布函數F(x)是(,)上的連續函數。(證明略。)這也是連續型隨機變量名稱的由來。三、常用連續型隨機變量的分布下面介紹幾個常用的連續型隨機變量及其分布。讀者同樣需要注意它們所對應的實際背景和概率模型。1.均勻分布第一
43、章我們曾經介紹過幾何概型,其特點是樣本點個數不可數但發生可能性相等。當樣本空間中的樣本點可以對應到實數軸的某個區間時,所得到的隨機變量稱為服從均勻分布。定義2-12若隨機變量X的密度函數為:f(x)ba間a,b上的均勻分布,記為XU(a,b).10axb其他,則稱X服從區0 xa通過積分可得此時隨機變量X的分布函數為:F(x)ba1度函數和分布函數圖像如下:xaaxb.均勻分布密xb圖2-4均勻分布密度函數圖2-5均勻分布分布函數例2-28設XU(0,2),試計算PX1,PX1,P0.75X1.25.解f(x)2100 x2其他,故PX0.5P0.5X0.50.5f(x)dx0.5dx110.
44、5024,PX1.51P0.75X1.251.25dx.11dx,1.524110.7524由此例題可以看出,服從均勻分布的隨機變量落入a,b內長度相同的子區間的概率相等。事實上,若XU(a,b),則對于c,da,b,cd,有PcXdF(d)F(c)dacadcbaba上述概率只于區間a,b的長度有關而與區間位置無關。,例2-29在0,1內任取一點記為X,求PX231X0.48解顯然XU(0,1),而X23111X(X)(X),故4824X0P(X)(X)PXPXPX2311111482424dx112140dx34.2.指數分布ex定義2-13若隨機變量X的密度函數為f(x)0則稱X服從參數
45、為的指數分布,記為XE().x0 x0,其中0為常數。0顯然f(x)0,x,而f(x)dxexdxex|101,故0指數分布密度函數滿足一般密度函數的兩條性質。通過積分可得其分布函數為:0F(x)1ex指數分布密度函數和分布函數圖像如下:x0 x0.圖2-6參數為的指數分布密度函數圖2-7指數分布分布函數指數分布又稱為壽命分布,一般涉及到時間長度問題多服從指數分布。特別是各類電子元器件使用壽命、服務系統兩次服務間隔時間、復雜系統中兩次故障出現時間等。例2-30某元件壽命服從參數為11000的指數分布,(1)求這樣的元件使用1000小時的概率;(2)已知元件使用500小時未損壞,問還可以繼續使用
46、1000小時的概率。1解依題意有記該原件壽命為X則XE(1000),則1(1)PX1000e1000dxe1000 xx100010001000也可代入分布函數直接得到:PX10001F(1000)1(1e1)e1.(2)PX1500|X500PX1500,X500PX500e1,1(1e2)PXx31F(1500)1(1e2)e11F(500)1.由上例可以看出,服從指數分布的隨機變量(表示某產品壽命),已知工作了x小時的條件下還能繼續工作x小時的概率,與無條件工作x小時的概率相等。似乎是服從指數分00,布的隨機變量對之前發生過的內容“失去了記憶”因此稱此性質為“無記憶性”。性質2.3.2設
47、XE(),則對于任意給定的x0和任意x0,均有下面結論成立:0PXxx|XxPXx.00證明設F(x)為指數分布的分布函數,對于x0,有PXx1PXx1F(x)ex,所以,PXxx|XxP(Xx0 xXx)0PXxxe(x0 x)0PXxexex0PXx.0定義2-14若隨機變量X的密度函數為f(x)1e22,x,其中3.正態分布(x)22,為常數,0,則稱X服從參數為,2的正態分布,記為XN(,2).其2e22dt.分布函數為:F(x)1x(t)2正態分布又稱為高斯分布。一般來說一個隨機模型如果包含大量小因素共同影響,這些小因素地位相近,其中不存在主導因素時,這一隨機模型就可以看做是服從正態
48、分布了。比如測量誤差、隨機身高、農作物收獲等等。下圖表示參數為,2的正態分布的密度函數和分布函數:圖2-9正態分布密度函數圖2-10正態分布分布函數正態分布的密度函數具有以下特點:(1)密度函數f(x)呈鐘形,且對稱軸為x;(2)當x時,密度函數達到最大值f(maxx)f()12;(3)正態分布密度函數在x產生拐點;(4)正態分布密度函數恒有f(x)0且以x軸為漸近線;(5)參數的意義:一般我們將正態分布密度函數中參數稱為位置參數,因為確定了密度函數圖像的中心位置;當大于0時圖像對稱軸在y軸右側,當小于0時圖像對稱軸在y軸左側;隨著的增大函數沿著x軸向右平移。參數稱為形狀參數。越大函數圖像越平
49、坦、越矮,越小函數圖像越陡峭、越高;(6)3原則:以x為中心,X的取值落入鄰域(,)中的概率為0.6828,落入鄰域(,2)中的概率為0.9546;落入鄰域(,3)中的概率為0.9974.即PX0.6826;PX20.9546;PX30.9974.以上結論稱為正態分布的3原則,它表明服從正態分布的隨機變量取值在3鄰域內已經非常接近1了。圖2-11正態分布參數變化對圖像的影響1(x)e2,圖2-12正態分布的3原則當0、1時,稱之為標準正態分布,即XN(0,1).一般我們用(x)來表示標準正態分布的密度函數:x22用(x)表示標準正態分布的分布函數即:1t22e2dt.(x)x圖2-13標準正態
50、分布密度函數圖2-14標準正態分布分布函數容易看出標準正態分布的密度函數關于y軸對稱,其最大值為12,分布函數圖像與y軸交于點(0,0.5),這說明當x0時,其分布函數值為0.5即PX00.5.對于正態分布,無法通過直接積分計算分布函數,因為yex22的原函數很難用初等函數表示。一般對于標準正態分布,若x0,則可以通過查本書附錄的標準正態分布表得到(x)。若x0,則可以利用以下性質轉化為取值x0的(x)來處理。性質(x)1(x).證明由密度函數的對稱性立即有:(x)PXxPXx1PXx1(x)命題得證。同時我們發現表中x取值只有x0,4.99,這是因為當x4.89時,(x)已經非常接近1了。也
51、就是說隨機變量X取值大于4.89的概率已經非常非常小,幾乎可以忽略不計。例2-31已知XN(0,1),(1)求PX1.96,PX1.96,PX1.96,P1X2;(2)已知PXa0.7019,PXb0.9232,求a,b.解(1)查表可得:PX1.96(1.96)0.9750,PX1.96(1.96)1(1.96)10.97500.0250,PX1.96P1.96X1.96(1.96)(1.96)(1.96)(1(1.96)2(1.96)10.95,P1X2(2)(1)(2)(1(1)(2)(1)10.97730.841310.8186,(2)因為PXa(a)0.7019,查表可得a0.53;
52、因為PXb2(b)10.9232,查表可得(b)0.9616即b1.77.那標準正態分布我們已經可以通過標準正態分布表來處理其概率的計算問題,么對于一般正態分布應該如何去處理它的概率計算問題呢?為此我們不加證明的給出下面兩個定理,其證明放在本章第四節討論。定理2-3若XN(,2),那么YXN(0,1).我們提供了一條通過標準正態分布處理一般正態分布的途徑,即可以通過YX定理2-4若XN(0,1),那么YXN(,2).由上面兩個定理可知,一般正態分布和標準正態分布可以通過變量替換相互轉化。這為的轉化將一般正態分布轉化為標準正態分布,從而查標準正態分布表來獲得一般正態分布的分布函數值。例2-32已
53、知XN(8,0.52),(1)求:F(9),F(7);(2)求P7.5X9,PX81,PX90.5.解(1)F(9)PX9PX898(2)0.9773,0.50.5PX81PX8X878F(7)PX7P(2)1(2)0.0227;0.50.57.58X898(2)P7.5X9P0.50.50.5(2)(1)(2)(1)10.8186,12(2)10.9546,0.50.5PX90.5P0.5X90.510.5X810.5P10.5X810.5P0.50.50.5X8P13(3)(1)0.99870.84130.1574.0.5例2-33已知XN(,2),若PX1.60.036,PX5.90.7
54、58,試求,以及概率PX0.1.6(解由于PX1.6PX1.6)0.036,且5.9(PX5.9PX5.9)0.758故有:5.931.61.80.73.8求解得:;PX01PX01PX3.83.81(1.27)0.898.33例2-34從南郊某地乘車前往北區火車站搭乘火車有兩條路線可走,第一條路線穿過市區,路程較短,但交通擁擠,所需時間(分鐘)服從正態分布N(50,100),第二條路線沿環城公路走,路程較長,但意外阻塞較少,所需時間服從正態分布N(60,16).若(1)有70分鐘時間;(2)有65分鐘時間。問在上述兩種情況下分別應該走哪條路線?i解顯然,路線選擇應該以允許時間內到達火車站概率
55、較大為準。設走第條路所需時間為X,i1,2,則i10(1)有70分鐘時,走第一條路及時趕到的概率為:PX70(70501)0.9772,走第二條路及時趕到的概率為:PX70(2好。70604)0.9938,顯然走第二條路更10(2)有65分鐘時,走第一條路及時趕到概率為:PX65(65501)0.9332,4走第二條路及時趕到概率為:PX65(6560)0.8944,顯然走第一條路更好。22.4隨機變量函數的分布服從參數n,1p的二項分布Y.同樣,在第三節我們利用變量替換YX在第二節中我們曾經利用變量替換YnX將服從參數n,p的二項分布X轉化為將服從參數,2的正態分布X轉化為標準正態分布Y.事
56、實上這兩個變化過程我們都可以將Y的取值看做是X取值分別代入函數yf(x)nx和yg(x)x中得到的,即Y是X的函數。隨機從一袋球中取一個,考察半徑,得隨機變量X;若考察其體積,則得隨機變量Y.4顯然Y與X之有函數關系Y=X3。3一、離散型隨機變量函數的分布設Yg(X),若X為離散型隨機變量,則Y的取值一定也是離散的。因此可以通過分布列的關系來討論Y的概率分布。事實上Y取某一值的概率等于取相應值的各概率之和。例2-35Y=4X3,其中分布列如下,求的分布列。3X123456P0.050.050.20.250.30.35解由與的關系可得隨機變量的可能取值為,32196,36,4500,333328
57、8,于是有:X1234564Y=X33433233619635003288P0.050.050.20.250.30.35故Y的分布列為:Y433233619635003288P0.20.050.050.250.30.35例2-36已知X的分布列如下,Y4X1,ZX2,求Y和Z的分布列。XP10120.20.10.30.4解因為Y4X1,故X1012Y4X1P30.210.150.390.4即有Y的分布列如下:Y3159P0.20.10.30.4由于ZX2,故X1012ZX21014P0.10.20.30.4當X1和X1時,均有ZX21,此時需要將同一取值的概率合并得:Z104P0.50.10.
58、4二、連續型隨機變量函數的分布當k0時,F(y)PkXybPXybkk故f(y)F(y)1kk與離散型隨機變量函數不同,連續型隨機變量的函數雖然也是隨機變量,但有可能取值是連續也有可能取值是離散的(如習題二中28題所示)。對于連續型隨機變量其函數是離散型隨機變量的,我們可以類比離散型隨機變量函數的處理,將函數值相同的取值點概率累加。此下面我們主要討論連續型隨機變量的函數為連續型隨機變量的情況。時連續型隨機變量函數的密度函數可以通過該隨機變量的密度函數推出。一般地若Y=f(X),YF(y),Y給定XF(x),即F(x)P(Xx),而Xx時,對應的Y=f(x),于是XXXF(x)=P(Yf(x)P
59、(Xx),這說明對于所求的函數Y=f(x)的分布函數可以考慮YYX轉化為自變量X的分布函數。對于一般的連續型隨機變量X,我們希望得到其函數Y的密度函數。只須先求Y的分布函數;由取值的對應關系可以將求Y的分布函數轉化為求X的分布函數;若已知X的密度函數,只須求積分即可得到X的分布函數。因此這里的關鍵就在于由函數值向自變量取值的轉化。一般地記Dx|f(x)y有:F(y)PYyPXDf(t)dt,則f(y)F(y).YXYYxD下面我們通過幾個例子來體會這種轉化。例2-37Xf(x),k0,求YkXb的密度函數。X解由于f(y)F(y),因此首先求Y的分布函數F(y).YYYF(y)PYyPkXby
60、PkXyb,YybF(),YXybf();YYXkk故f(y)F(y)1kk當k0時,F(y)PkXybPXYybf();YYXybyb1F(),X綜上有:f(y)1kXkybf().Y注:上例中所得結果具有一般性,可以作為公式使用。例2-38設XN(,2),證明:YXN(0,1).解F(y)PYyPYXyPXyFX(y),e22,代入即得:故f(y)F(y)f(y).YYX由于XN(,2),即f(x)X12(x)2f(y)Y12e(y)2221y2e2,即YN(0,1).21X注:由于YX,此題也可以直接代入以上公式得。請讀者自己驗證。例2-39XN(,2),證明:YaXbN(ab,a22)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 除四害健康教育
- 血透個案護理實踐與案例分析
- 心理健康科普知識宣傳
- 2025年安徽蚌埠市淮上區區屬國有企業招聘考試筆試試題(含答案)
- 2025年國家京劇院公開招聘畢業生13人筆試歷年典型考題及考點剖析附帶答案詳解
- 己亥雜詩 教學課件
- 食管異物的教學課件
- 六年級英語口語教學課件
- 暖通工程效益分析報告
- 網絡著作權的爭議案例
- 2025至2030中國柔性直流輸電行業運營規劃及發展前景深度分析報告
- 安全產風險管理制度
- 深化國有企業改革調研提綱
- 小學騎車安全課件
- 公司個人獨資章程范本
- 《中國酒類企業ESG披露指南》
- 2025年航空安全管理專業考試試卷及答案
- 2025至2030年中國玉米淀粉行業市場現狀分析及前景戰略研判報告
- 2025高考全國一卷語文真題
- GB/T 1094.1-2013電力變壓器第1部分:總則
- SAE-J400-2002-中文版
評論
0/150
提交評論