第六章-數理統計的基本概念_第1頁
第六章-數理統計的基本概念_第2頁
第六章-數理統計的基本概念_第3頁
第六章-數理統計的基本概念_第4頁
第六章-數理統計的基本概念_第5頁
已閱讀5頁,還剩61頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、概率論與數理統計概率論與數理統計 從本章起,我們轉入課程的第二部分從本章起,我們轉入課程的第二部分數數理統計學。數理統計學與概率論是兩個密切聯理統計學。數理統計學與概率論是兩個密切聯系的姊妹學科。系的姊妹學科。 大體上可以這樣說,大體上可以這樣說,概率論是數理統計學的概率論是數理統計學的基礎,而數理統計學是概率論的重要應用。基礎,而數理統計學是概率論的重要應用。概率論與數理統計概率論與數理統計 數理統計學是這樣一門學科:它使用概率論和其它數學方法,研究怎樣收集怎樣收集(通過試驗和觀察)帶有隨機誤差的數據,并在設定的模型(稱為統計模型)之下,對這種數據進行分析分析(稱為統計分析),以對所研究的問

2、題作出推推斷斷(稱為統計推斷)。 由于所收集的統計數據(資料)只能反映事物的局部特征,數理統計的任務就在于從統計數理統計的任務就在于從統計資料所反映的局部特征以概率論作為理論基礎資料所反映的局部特征以概率論作為理論基礎去推斷事物的整體特征。去推斷事物的整體特征。概率論與數理統計概率論與數理統計 用局部推斷整體,這就使得數理統計所作推斷的結論不可避免地存在偏差或錯誤,而刻畫或把握這種偏差的有效方法就是概率論。概率論通過給出各種各樣的統計量所服從的分布或數字特征,來演繹地評價各種統計方法的優劣或置信程度。概率論與數理統計概率論與數理統計 總體、樣本和統計量總體、樣本和統計量 概率論與數理統計概率論

3、與數理統計6.1.1 6.1.1 總體與樣本總體與樣本 在數理統計中,我們將研究對象的某項數量指標的值的全體稱為總體總體,總體中的每個元素稱為個體個體。 例:對電子元件我們主要關心的是其使用壽命。 某廠生產的所有電子元件的使用壽命值的全體, 就構成了研究對象的全體,即總體。 可以認為總體是一個隨機變量,常用X表示。 如:設電子元件的壽命為隨機變量X,其所有可能取值的全體就構成總體。概率論與數理統計概率論與數理統計 為方便起見,今后我們把總體與隨機變量X等同起來看, 即總體就是某隨機變量X可能取值的全體。它客觀上存在一個概率分布,但我們對其概率分布一無所知,或部分未知,正因為如此,才有必要對總體

4、進行研究。 按機會均等的原則隨機地從客觀存在的總體中抽取一些個體進行觀察或測試的過程稱為隨機抽隨機抽樣樣。從總體中抽出的部分個體,叫做總體的一個樣本樣本。概率論與數理統計概率論與數理統計 從總體中抽取樣本時,不僅要求每一個個體被抽到的機會均等(代表性代表性),同時還要求每次的抽取是獨立的(獨立性獨立性),即每次抽樣的結果不影響其他各次的抽樣結果,同時也不受其他各次抽樣結果的影響。這種抽樣方法稱為簡單隨機抽簡單隨機抽樣樣。由簡單隨機抽樣得到的樣本叫做簡單隨機樣簡單隨機樣本本。往后如不作特別說明,提到“樣本樣本”總是指總是指簡單隨機樣本。簡單隨機樣本。概率論與數理統計概率論與數理統計 從總體X中抽

5、取一個個體,就是對隨機變量X進行一次試驗。在抽樣時抽取n個個體就是對隨機變量X進行n次試驗, 得到n個個體分別記為X1, X2, , Xn 。則樣本就是n維隨機變量( X1, X2 , , Xn )。在一次具體抽樣以后, (X1, X2, , Xn )就有了一組確定的值(x1, x2, , xn),稱為樣本觀測值樣本觀測值。稱 ( X1, X2, , Xn )為樣本樣本,n為樣本容量樣本容量. .概率論與數理統計概率論與數理統計 個體的二重性:從總體X中抽取一個個體(但抽取個體的試驗未結束,或理解為試驗是形式上的),該個體的值是不確定的,此時抽取的個體仍用隨機變量Xi 表示,它和總體X同分布;

6、從總體X中抽取一個個體(對個體的試驗結束,或試驗有具體結果),該個體的值是確定的,此時抽取的個體是觀測值xi 。概率論與數理統計概率論與數理統計 根據隨機變量獨立性定義及獨立隨機變量的分布函數和密度函數的定理,有命題命題6.1.1 設總體XF( ,), (X1 , X2 , , Xn)為其樣本,則 F(,)可以是分布函數,也可以是密度函數(對連續型隨機變量),或是分布律(對離散型隨機變量)。如對于連續型隨機變量,F(,)可以是密度函數,即1212 , , 12 1 2 ( ,; )( , )(, )(, )nnXXXnXXXnFx xx Fx Fx Fx 1212 , , 12 1 2 ( ,

7、; )( , )(, )(, )nnXXXnXXXnfx xx fx fx fx 概率論與數理統計概率論與數理統計例例6.1.1 設總體XN(,2), (X1 , X2 , , Xn)為其樣本,則(X1 ,X2 , , Xn)的聯合概率密度函數為1212222122222 , , 222 ()()()222222211212(; ,)( , ,)(, ,)(, ,)1112221(2)exp()2,nnnXXXXXXxxxnnnini ffffeeex xxxxxx 概率論與數理統計概率論與數理統計統計量的定義統計量的定義 設設X1,X2,Xn為來自總體為來自總體X的的樣本,稱樣本,稱不含未知

8、參數的樣本的函數不含未知參數的樣本的函數 g(X1,X2,Xn)為統計量為統計量 若若x1,x2,.,xn為樣本觀測值,則稱為樣本觀測值,則稱g(x1,x2,.,xn)為統計量為統計量g(X1,X2,Xn)的觀的觀測值測值.統計量是處理、分析數據的主要工具對統計量統計量是處理、分析數據的主要工具對統計量的一個最基本的要求就是可以將樣本觀測值代入的一個最基本的要求就是可以將樣本觀測值代入進行計算,因而不能含有任何未知的參數進行計算,因而不能含有任何未知的參數 概率論與數理統計概率論與數理統計【例例】設設X1,X2,Xn是來自總體是來自總體X的樣本,的樣本,XN( , 2),其中,其中 、 2為未

9、知參數,則為未知參數,則 X1, min X1,X2,Xn 均為統計量,但諸如均為統計量,但諸如等均不是統計量,因它含有未知參數等均不是統計量,因它含有未知參數 或或 ,312121XX ,)(112 niiXn 1X概率論與數理統計概率論與數理統計12nn121(1) ( ) (11,)()niiRmXXXXean xxx xxXnn軟件用函數計算樣本均常用的值,其:中 為樣本觀測值。統計量樣樣本本均均值值概率論與數理統計概率論與數理統計121221(2)var( )1() 1)nnnniiiiSXXn RxnSXnnX軟件用計算樣本方差。樣樣本本方方差差 樣樣本本標標準準差差 22122v

10、ar( )(1)1) 1nniinnRxnSSXXnnS 軟件用計算修正樣本方差。 顯然,。修修正正樣樣本本方方差差 概率論與數理統計概率論與數理統計 1( )1 3nkkiiXXnk 樣樣本本 階階原原點點矩矩11( ) (4)nkiiXXnk 樣樣本本 階階中中心心矩矩概率論與數理統計概率論與數理統計(1)12(1)(2)1)2(12()(5) min,max,nnnnknXXXXXXXXXXXXXXXk其中而是將的取值從小到大排列后第 位的值。統統計計順順序序量量1()2()(1)22 1()(2(6) )nnnXnXXXnRmedian x為奇數軟件用函數計算樣本中位數為數。偶樣樣本本

11、中中位位數數( )(1)(7)max( )min( )XnnRXxXxR軟件用計算樣本極差。樣樣本本極極差差 概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計概率論與數理統計o為了用概率的方法探討一個統計量在推斷總為了用概率的方法探討一個統計量在推斷總體時的性能或把握推斷結論的置信程度,我體時的性能或把握推斷結論的置信程度,我們必須要知道統計量的分布或近似分布們必須要知道統計量的分布或近似分布. .統計統計量的分布,通常稱為量的分布,通常稱為抽樣分布抽樣分布. .o先討論統計量的數字特征先討論統計量

12、的數字特征. .概率論與數理統計概率論與數理統計122222*22 , ,1, (1)2,6. .13.nnnXXXXE XVar XE XVar XnnE SE Sn設()是取自總體 的一個樣本, 則() (=命) 題概率論與數理統計概率論與數理統計1111111nnniiiiiE XEXE Xnnn證明: ()222111111nnniiiiiVar XVarXVar Xnnnn2222112211222221111(2)()(2)1 (2)11 2nnniiiiinniiiinniiiiSXXXX XXnnXXXnXnXXXXXnn概率論與數理統計概率論與數理統計222221122122

13、222111 ( ) ( ) 11)1 (nnniiiiniiiE SEXXE XE XnnVar XE XVar XE Xnnnnnn*222211nnnnnE SESE Snn概率論與數理統計概率論與數理統計1. 2分布分布(為簡便計,不通過(為簡便計,不通過分布,直接給出分布,直接給出 2 2分布分布定義定義 ) 命題命題6.3.2 設設X1,X2,Xn為相互獨立的隨機變量,它們都服從標準正為相互獨立的隨機變量,它們都服從標準正態態N(0,1)分布,則稱隨機變量分布,則稱隨機變量服從服從自由度自由度為為n的的 2分布分布,記為,記為X 2 (n)此處自由度指包含獨立變量此處自由度指包含獨

14、立變量Xi的個數的個數可以證明,可以證明, 2(n)的概率密度為的概率密度為其中其中 ( )稱為伽馬函數稱為伽馬函數.21niiXX122221,0( )2( )0,0nxnnXxexfxx0,)(01 dxexx概率論與數理統計概率論與數理統計 2分布概率密度分布概率密度o o 圖圖6.1 2(n)分布的概率密度曲線分布的概率密度曲線可以看出,隨著可以看出,隨著n的增大圖形趨于的增大圖形趨于“平緩平緩”,其圖形下區域的,其圖形下區域的重心亦逐漸往右下移動重心亦逐漸往右下移動122221,0( )2( )0,0nxnnXxexfxx概率論與數理統計概率論與數理統計 2分布具有下面性質:分布具有

15、下面性質: 222122122(1) ( ), , 2(2) (), (), () (3) ( ), () /2 (0,1).XnE XnVar XnXnYnXYXYnnXnnXnnN若則若且與 相互獨立, 則 若,則當 趨于無窮大時 近似服從21222212(1) ( ), ,(0,1) nnXnXXXNXXXX若則有相互獨立的都服從使得證:222101 1,2,iiiE XVar XE Xin 概率論與數理統計概率論與數理統計2221222212 E nnXE XXXE XE XE Xn則222424221 13 12, 1,2,2iiixVar XE XE Xx edxin 222122

16、2212 2nnVar XVar XXXVar XVar XVar Xn則1212221212122212222122(2) (), (), ,(0,1) , nnnnXnYnXYXYYYYXXXXXYNXYY若且與 相互獨立, 則有相互獨立的都服從使得2122121(3) ( ),(0,1),1lim()/2= lim()= ( )2,()/2 (0,1).nniininniXnXXXNXXPXnnxPXnxxnnXnnN若,則有相互獨立的都服從, 由中心極限定理:當 趨于無窮大時近似服從122222221212212 () nnXXXYYYXYXYnn則 221213223(0,3)(32

17、,)NYaXbXXXXaXbY設是來自總體的樣本,且 問取何值例時, 服從:分布。1232223(0,3), 1,2,30 (0,1),3 323323( )(0,39)320(03,1)3902 0iXNiXNXXNNXXN 因為而, : ,解22223132(2)339XXX211,(2)339abY當時,分布。概率論與數理統計概率論與數理統計2. t分布分布命題命題6.3.3 設設X N( 0,1),Y 2(n),X與與Y獨立,則稱隨機變獨立,則稱隨機變量量 服從自由度為的服從自由度為的t分布分布,又稱為學生氏分布,又稱為學生氏分布記為記為T t(n)可以證明可以證明t(n)的概率密度為

18、的概率密度為 圖圖6-2 t分布的概率密度曲線分布的概率密度曲線nYXT 122T12( )1,2nnfxnnnxx 概率論與數理統計概率論與數理統計可看出,隨著可看出,隨著n的增大,的增大,t(n)的概率密度曲線與的概率密度曲線與N(0,1)的概率密的概率密度曲線越來越接近度曲線越來越接近可以證明可以證明t分布具有下面性質:分布具有下面性質:即當即當n趨向無窮時趨向無窮時,t(n)近似于標準正態分布近似于標準正態分布N(0,1) 一般地,若一般地,若n 45,就可認為,就可認為t(n)基本與基本與N(0,1)相差無幾了另外,經積分相差無幾了另外,經積分可知,若可知,若 X t(n), 則則

19、221( ),2xTfxen 0 (1), (2) 2E XnVar Xnnn概率論與數理統計概率論與數理統計12122234566(0,1),()()Nc XXtXXXXXXX設是來自總體的樣本,試確定正數c 使得服從 分布,并指出其例:自由度。1212(0,1), 1,2,60(0 2)(0,1)2iXNiXXXXNN解因為, , 則 :34562223456(0,1)(0,1)22+222XXXXNNXXXX同理, , ,且獨立則 ( )概率論與數理統計概率論與數理統計22345634521162222+2= (2)+2222XXXXXXXXXXtXcX取概率論與數理統計概率論與數理統計

20、22 (),( ),/(, )(, )6.3.4,.XmYnXYXmFYnm nFFF m nm n設且與相互, 稱隨機變量 服從自由度為的分布,記為。分別稱為第一自由度和第二自由度命題獨立3 3. . F F分分布布 1222()/22,0( )220,0mmnm nFmnmnxmnfxmxxFnx可以證明, 的概率密度函數為概率論與數理統計概率論與數理統計 圖圖6.3 F分布的概率密度曲線分布的概率密度曲線 由由F分布的定義分布的定義容易看出,容易看出, 若若F F(m,n),則,則1/F F(n,m)X mFY n概率論與數理統計概率論與數理統計 在統計推斷(區間估計和假設檢驗)中,已知

21、總在統計推斷(區間估計和假設檢驗)中,已知總體體X的分布及某概率值的分布及某概率值,需要知道,需要知道X小于等于哪個小于等于哪個數數的概率為的概率為,這個數稱為,這個數稱為X的的分位數,也就是,分位數,也就是, 設設X(n)(為某種分布,為某種分布,n為有關自由度為有關自由度), 001,0.5的分位數,需利用對稱性間接查45),可用正態分布近似,即 ,222( )()/2(0,1), ()/22( )( )XnnXnnNnnnnnnnuu:當時,則當 趨于無窮大時,近似地服從。所以,在 較大時 得 注意2220.950.95 (60)( ) 2(60)=qnorm(0.95) 2 60 60

22、 78 01847 nun n. 查表時,若查不到,(n=6045),可用正態分布近似,即 ,概率論與數理統計概率論與數理統計0.950.100.90(2) (10) (0.95,10) 1.812461 (20) (0.10,20) -1.325341(50) (0.90,50) 1.298714tqttqt tqt0.900.900.90(50) ( ) (50)(0.90)1.281552ttnutuqnorm 查表時,若查不到,(n=6045),可用正態分布近似,即 ,( )0,1( )()(t nnNtnuntunt對于分布,當 趨于無窮時,其極限分布為,所以當自由度n較大時,可用標

23、準正態分布的分位數代替的分位數。即 注意:概率論與數理統計概率論與數理統計0.990.05(3) (5,4)(0.99,5,4)15.52186(3,7)(0.05,3,7)0.1125272Fqf Fqf10.0500.0955.1(3,7)()()11(3,7)0.1125272(7,3)(0.95,7,3,)FFFFFnm nqfm 查表時,查不到,用 計算,概率論與數理統計概率論與數理統計122221(,.,)(0,1),(0, )(1) , 6.3.1nnnnXXXXNXNnSnXS設是來自總體 的一個樣本 則樣本均值, 并且(抽樣分布基本定理與相互獨立.略)(證明定理一、單個正態總

24、體的抽樣分布一、單個正態總體的抽樣分布概率論與數理統計概率論與數理統計 推論推論6.3.1 設(X1,X2,Xn)是來自總體XN(,2)的樣本,則2*221222*22122()(1)(2)(1)() (1)ninininiXXnSnXXnSn2*2(1);nnXSS樣本均值 與樣本方差(修正)(或)相互獨立概率論與數理統計概率論與數理統計*()=-1 (1)nnXnXnt nSS2122(,.,)(6.3.2,),nnXXXXNXS 設是來自總體的一個樣本與分別為其樣本均值與樣本推方差論則) 1 , 0()(/, ),(2NXnnXnNX即因為2*22122()(1)(1)niniXXnSn

25、又證明:證明:且它們表示的隨機變量是相互獨立的,故*22()/ (1)(1)(1)nnnXXnXnTt nSSnSn29*1222109*11910( ,)3()11, =() , 9810,niiiiNXXXXXXXSXXTST 設是來自總體的樣本,記 確定例(習題6.5):服從何種分布。29211100012( ,), 1,2,10110(0,(0,1)10), 999iiiXNiXXNXXXXN :則解1010*9*2292*29102923, (8)108(888)SSXXXXtS由推論知,得概率論與數理統計概率論與數理統計解:解: ) 1 , 0(/2NnXnX(0.05)(10.9

26、5)/20.975n) 1 . 0|(|XPnnXnP/21 . 0/2/21 . 0)05. 0()05. 0(nn95. 01)05. 0(2n所以概率論與數理統計概率論與數理統計解解 :*22(10 1)(9)4nS*2*2*2999(2.622)2.62215.8995 ,444nnnP SPSPS 查表得 20.25(9)5.899則有 *2(2.622)0.75nP S由于概率論與數理統計概率論與數理統計二、兩個正態總體下的抽樣分布二、兩個正態總體下的抽樣分布12211*2211121222*22211,(,.,)(,):11,()1( ,.,)(,),11,()1mmmimiii

27、nnniniiiXYXXXXNXXSXXmmY YYYNYYSYYnn 設總體 與 相互獨立是來自總體的一個樣本是來自總體的一個樣本概率論與數理統計概率論與數理統計122212()()(0,1)/XYNmn結論結論1:證證 明明:221212(,)(,)XNYNmn由于與獨立221212(,)XYNmn所以122212()()(0,1)/XYNmn因此概率論與數理統計概率論與數理統計12()() (2)11wXYt mnSmn*2*2212(1)(1)2mnWmSnSSmn其中 注注: :此結論只有在兩個總體的方差相等時才成立此結論只有在兩個總體的方差相等時才成立. .122*2112122*

28、22,(,.,)(,2(6.3.4),;( ,.,)(,):),;mmnnXYXXXXNXSY YYYNYS 設總體 與 相互獨立是來自總體的一個樣本與分別為其樣本結均值與修正樣本方差是來自總體的一個樣本與分別為其樣本均值與修正推論樣本方差論則概率論與數理統計概率論與數理統計21(,)XNm12()()(0,1)11XYUNmn22(,)YNn1*222(1)(1)mmSm2*222(1)(1)nnSn*2*222222(1)(1)(2)mnmSnSVmn12()() (2)/(2)11wXYUTt mnVmnSmn 證明證明: (1)因為所以(2)因為(3)故所以概率論與數理統計概率論與數理統計2*222112222*2221211(1,1)1mmnnmSSnFF mnnSmS*21*22(1,1)mnSFF mnS特別,當12 = 22時,有122*2111122*2222,(,.,)(,),;( ,.,)(,)3,;:mmnnXYXXXXNSY YYYNS 設總體結論(推論6.3.3)與 相互獨立是來自總體的一個樣本為其修正樣本方差是來自總體的一個樣本為其修正樣本方差 則概率論與數理統計概率論與數理統計證明證明:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論