1概率論與數理統計第六章_第1頁
1概率論與數理統計第六章_第2頁
免費預覽已結束,剩余32頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章樣本及抽樣分布前面五章我們講述了概率論的基本內容,隨后的四章將講述數理統計數理統計是具有廣泛應用的一個數學分支, 它以概率論為理論基礎, 根據試驗或觀察得到的數據, 來研究隨 機現象,對研究對象的客觀規律性作出種種合理的估計和判斷數理統計的內容包括:如何收集、整理數據資料;如何對所得的數據資料進行分析、研究,從而對所研究的對象的性質、特點作出判斷后者就是我們所說的統計推斷問題本書只講述統計推斷的基本內容在概率論中,我們所研究的隨機變量, 它的分布都是已知假設的, 在這一前提下去研究 它的性質、特點和規律性,例如求出它的數字特征,討論隨機變量函數的的分布,介紹常用的各種分布等在數理統計中,

2、我們研究的隨機變量,它的分布是未知是的,或者是不完全 知道的,人們是通過對所研究的隨機變量進行重復獨立的觀察,得到許多觀察值, 對這些數據進行分析,從而對所研究的隨機變量的分布作出種種推斷的本章我們介紹總體、隨機樣本及統計量等基本概念,并著重介紹幾個常用統計量及抽樣 分布1隨機樣本我們知道,隨機試驗的結果很多是可以用數來表示的,另有一些試驗的結果雖是定性的,但總可以將它數量化例如,檢驗某個學校學生的血型這一試驗,其可能結果有0型、A型、B型、AB型 4 4 種,是定性的如果分別以 1,2,3,4,1,2,3,4,依次記這 4 4 種血型,那么試驗的結果就 能用數來表示了 在數理統計中,我們往往

3、研究有關對象的某一項數量指標(例如研究某種型號的燈泡的壽命這一數量指標)為此,考慮這一數量指標相聯系的隨機試驗,對這一數量指標進行 試驗或觀察我們將試驗的全部可能的觀察值稱為 總體,這些值不一定都不相同,數目上也 不一定是有限的,每一個可能觀察值稱為 個體總體中所包含的個體的個數稱為總體的容量容量為有限的稱為 有限總體,容量無限的稱為 無限總體例如在考察某大學一年級男生的身高這一試驗中,若一年級男生共20002000 人,每個男生的身高是一個可能觀測值, 所形成的總體中共含 20002000 個可能觀測值,是一個有限總體又如 考察某一湖泊中某種魚的含汞量,所得總體也是有限總體觀察并記錄某一地點

4、每天(包括以往、現在和將來)的最高氣溫,或者測量一湖泊任一地點的深度,所得總體是無限總體. .例如,考察全國正在使用的某種型號燈泡的壽命所形成的總體,由于可能觀測值的個數很多,就可以認為是無限總體總體中的每一個個體是隨機試驗的一個觀測值,因此它是某一隨機變量X的值,這樣,一個總體對應于一個隨機變量X. .我們對總體的研究就是對一個隨機變量X的研究,X的分布函數和數字特征就稱為總體的分布函數和數字特征. .今后將不區分總體與相應的隨機變量,籠統稱為總體X. .例如,我么檢驗自生產線出來的零件是次品還是正品,以 0 0 表示產品為正品, 以 1 1 表示產品為次品設出現次品的概率為P(常數),那么

5、總體是由一些“ 1 1”和一些“ 0 0”所組成, 這一總體對應于一個具體的參數為P的(0 0 1 1)分布:PX二X二px(1 - p)J,x =0,1的隨機變量我們就將它說成是(0 0 1 1)分布總體意指總體中的觀察值是 (0 01 1)分布 隨機變量的值又如上述燈泡壽命這一總體的是指數分別總體,意指總體中的觀察值是指數 分布隨機變量的值在實際中,總體的分布一般是未知的, 或只知道它具有某種形式而其中包含著未知參數 在數理統計中,人們都是通過從總體中抽取一部分個體,根據獲得的數據來對總體分布得出推斷的被抽出的部分個體叫做總體的一個樣本所謂從總體抽取一個個體, 就是對總體X進行一次觀察并記

6、錄其結果我們在相同情況 下對總體X進行n次重復的、獨立的觀察將n次觀察結果按試驗的次序記為X1,X2l,Xn 由于X1,X2l,Xn是對隨機變量X觀察的結果,且各次觀察是在相同的條 件下獨立進行的,所以有理由認為X1,X2H,Xn是相互獨立的,且都是與X具有相同分布 的隨機變量這樣得到的X1,X2山Xn稱為來自總體X的一個簡單隨機樣本,n稱為這樣樣本的容量以后如無另外說明,所提到的樣本都是指簡單的隨機樣本當n次觀察一經完成,我們就得到一組實數Xl,X2i,Xn,它們依次是隨機變量X2, Xn的觀察值,稱為樣本值對于有限總體,采用放回抽樣就能得到簡單隨機樣本,但放回抽樣使用起來不方便,當個體的總

7、數N比得到的樣本的容量n大得多時,在實際中可將不放回抽樣近似地當作放回抽樣來處理至于無限總體,因抽取一個個體不影響它的分布,所以總是用不放回抽樣例如,在生產工程中,每隔一定時間抽取一個個體,抽取n個就得到一個簡單隨機樣本,實驗室中的記錄,水文、氣象等觀察資料都是樣本試制新產品得到的樣品的質量指標,也常被認為是樣本綜上所述,我們給出以下定義 定義設X是具有分布函數F的隨機變量,若Xi,X2,川,Xn是具有同意分布函數F的、相互獨立的隨機變量,則稱Xi,X2H,Xn為從分布函數F(或總體F、或總體X) 得到的容量為n的簡單隨機樣本, 簡稱樣本,它們的觀察值Xi,X2,|l(,Xn稱為樣本值,又稱

8、為X的n個獨立的觀察值. .也可以將樣本看成是一個隨即向量,寫成(Xi,X2|,Xn),此時樣本值相應的寫成(Xl,X2,|1( , Xn).若(為,x21(,焉)與(,y2l( ,yn)都是相應于樣本( 的樣本值,一般來說它們是不相同的 由定義得:若Xi,X2,川,Xn為F的一個樣本,則Xi,X2,|山Xn相互獨立,且它們的分布函數都是F,所以(Xi,X2山Xn)的分布函數為nF ”(Xi,X2l(,Xn)刑F(X)=1又若X具有概率密度f,則(Xi,X2H,Xn)的概率密度為Xi,X2,川,Xn)nf訟公2,川,Xn) = f (X)k42抽樣分布樣本是進行統計推斷的依據在應用時,往往不是

9、直接使用樣本本身,而是針對不同的 問題構造樣本的適當函數,利用這些樣本的函數進行統計推斷定義設Xl,X2,|H,Xn是來自總體X的一個樣本,g(Xl,X2,|l( ,Xn)是Xi,X2H,Xn的函數,若g中不含未知參數,則稱g(Xl,X2川,Xn)是一統計量. .因為Xi,X2川|,Xn都是隨機變量,而統計量g(Xi,X2,|l( ,Xn)是隨機變量的函數,因 此統計量是一個隨機變量. .設Xl,X2l(,Xn是相應于樣本Xi,X2,|H,Xn的樣本值,則稱g(Xi,X2,川,Xn)是g(Xi,X2川,Xn)的觀察值. .下面列出幾個常用的統計量. .設Xl,X2,川,Xn是來自總體X的一個樣

10、本,Xl,X2l(,Xn是這一樣本的觀察值定義樣本平均值:-1nXXini T;樣本方差:1n-1n一S2(Xi-X)2( Xi2-nX)n 1idn -1ij;樣本標準差:x二丄一Xin V以-;)2二七(x2-nx)n 1 y1nakxi, k1,2,1 11n1n-bk(x -x)k,k =1,2,|l(n y這些觀察值仍分別稱為樣本均值、樣本方差、樣本標準差、樣本k階(原點)矩以及樣本k階(原點)樣本k階中心矩它們的觀察值分別為s二/S21n- 2H (Xi-X)n -1i j;;1nAkXik,k =1,2,|n yBk丄(Xin y k-X) ,k 211(樣本k階中心矩我們指出,

11、若總體X的k階矩E(Xk)Tk存在,則當n:時,Pk kk人一-.k,k21 1(.這是因為Xi,X2,|H ,Xn獨立且與X同分布,所以Xi,X2,|(Xn獨立且與xk同分布. .故有kkkE(Xi)=E(X2)=|( = E(Xn)7k,k =1,2,10從而由第五章的辛欽定理知1nAk=八XikPk,k=i,2,川ni呂進而由第五章中關于依概率收斂的序列的性質知道其中g為連續函數這就是下一章所要介紹的矩估計法的理論根據經驗分布函數此外,我們還可以作出與總體分布函數F(x)相應的統計量經驗分布函數它的作法如下:設Xi,X2山Xn是總體F的一個樣本,用S(x),一:表示Xi,X2,l比Xn中

12、不大于X的隨機變量的個數. .定義經驗分布函數Fn(X)為iFn(x)S(x), -:: x::n對于一個樣本值,那么經驗分布函數Fn(x)的觀察值是很容易得到的( (Fn(x)的觀察值仍以Fn(x)表示). .例如(i i)設總體F具有一個樣本值 i,2,3i,2,3,則經驗分布函數F3(x)的觀察值為0,若x1,-,若1蘭x c2,F3(X) = 32卄-,右2 Exc3,31,若x蘭3.(2(2)設總體F具有一個樣本值 1,1,21,1,2,則經驗分布函數F3(X)的觀察值為0,右X c1,2卄F3(x) =,右1豈x:2,31,若x _2.一般,設x1,x2,|l(,Xn是總體F的一個

13、容量為n的樣本值. .先將為公2,|(,的次序排列,并重新編號設為X(1)- X(2)- II ( - X(n).則經驗分布函數Fn(X)的觀察值為0,右X vx(1),k卄Fn(X),右X(k)士X:X(k+1),P卄1,若X X(n).對于經驗分布函數Fn(x),格里汶科(Glivenko)(Glivenko)在 19331933 年證明了一下結果:數x,當n二時Fn(x)以概率 1 1 一致收斂于分布函數F (x),即因此,對于任一實數x當n充分大時,經驗分布函數的任一個觀察值Fn(x)與總體分布函數Xn按自小到大對于任一實P dim supn x:.::Fn(x)F(x)|=o=1.F

14、(X)只有微小的差別,從而在實際上可以當作F(x)來使用. .統計量的分布稱為 抽樣分布,在使用統計量進行推斷時常需知道它的分布 當總體的分布函數已知時,抽樣分布是確定的,然而要求出統計量的精確分布,一般來說是困難的本節介紹來自正態總體的幾個常用的統計量的分布_ 2(一) 分布設Xl,X2,|H,Xn是來自總體N(,1)的樣本,則稱統計量2=Xi2 X; IHXn此處,自由都是指(2.12.1 )式右端包含的獨立變量的個數(n)分布的概率密度為-L 1n 2 4.y 2f(y)二2n(n 2)y!o,其它.f(y)的圖形如圖 6 6 1 1 所示. .服從自由度為n的$分布,記為(2.1(2.

15、1)(2.2(2.2) )11現在來推求(2.22.2)式. .首先由第二章 5 5 例 3 3 及第三章5 5 例 3 3 知2(1 1)分布即為2,2)分布. .現n2八Xi2L(n,2),V V2 2( 2.32.3)2即得的概率密度如(2.22.2)式所示. .2分布的可加性設L2(5),22(n2),并且f,I獨立,則有122L2(n1n2).(2.42.4)分布的數學期望和方差若2L2(n),則有E(32)= n, D(Z2)=2n(2.52.5)事實上,因XiLN(0,1),故E(X:) =D(XJ =12D(X:) =E(X:)-|_E(Xi2)=3-1 =2,i =1,2,|

16、ll,n于是XL N(0,1),由定義Xi2Lx%),即Xi2L(昇i =1,2,l|l, n.再由X1,X2,|,Xn的獨立性知X12,X;,|HX;相互獨立,從而由分布的可加性(見第三章5 5 例 3 3)知根據分布的可加性易得彳分布的可加性如下:f n、nE(F) = E2 Xi2=送E(X;)= n,2丿 72 2 2D( ) =D a Xj八D(Xj) =2n.Jy 丿 y對于給定的正數 a,a, : a a : 1 1, ,稱滿足條件已制成表格,可以查用(參見附表4 4). .例如對于a=0.1=0.1 ,n=25=25,查得該表只詳列到n=25為止,費歇(R.A.FisherR.

17、A.Fisher)曾證明,當n充分大時,近似的有(2.7(2.7)2其中Za是標準正態分布的上a分位點利用(2.72.7)式可以求得當n,45時(n)分布的上a分位點的近2分布的分位點的點2a(n)為PC2瞪(n) =J;(n)f (y)dy = a(2.6(2.6)2(n)分布上(25) = 34.382但似值. .監05(50)対1(1645+屈)2=67.221例如,由(2.72.7)式可得.2(由更詳細的表得2Zo.o5(50)=67.505). .)t分布設X L N(0,1),Y工(5),且X,Y獨立,則稱隨機變量服從自由度為n的t分布. .記為tLlt(n)t分布又稱學生氏(St

18、udentStudent)分布. .t分布的概率密度函數為h(t) =T!2(+;L)f卡y,亠t4545 時,對于常用的的值,就用正態近似:(2.13(2.13)三)F分布設uL2(ni), 252),且u ,V獨立,則稱隨機變量(2.12(2.12)u nivn2服從自由度為(ni,n2)的F分布,記為FLF(ni,n2). .F(n 1,n2)分布的概率密度為fT( m+n2)/2(n-i,n2)ni/2y(n2 2)毋(y)=壯(山/2)叭nj2)l+(m y/匕)(血)2)y 0,其它(證略)圖 6 65 5 中畫出了(y)的圖形. .(2.14(2.14)(2.15(2.15)由定

19、義可知,若FL F(ni,n2),則F(n2,ni)(2.16(2.16/圖 6 6 5 5F分布的分位點對于給定的a,0 : a : 1,稱滿足條件E(X)=二,D(X) = J n(2.19(2.19)的點卩丿山小2)為Fgm)分布的上分位點(圖 6 66 6). .F分布的上分位點(圖 6 66 6). .F分布上:分位點有表格可查(見附表5 5). .圖 6 6 6 6F分布的上:分位點有如下的重要性質:斤一:(厲,阿二FJn)Fa(n2,ni丿(2.182.18)(2.182.18)式常用來求F分布表中未列出的常用的上:分位點例如,1 1FO95(12,9)=-=0.357FO.O5

20、(9,12) 2.80(四)正態分布的樣本均值與樣本方差的分布設總體X(不服從什么分布,只要均值和方差存在)的均值為 方差為二2,XjXzJhXn是來自X的一個樣本,X,S2PlF FgepJWdy-(2.17(2.17)是樣本均值和樣本方差,則總有E(S2) = E1Xi2一nX?ILn-1y1n22E(Xi2)- nE(X )n -1 II4二丄、-(二2+2) -n(;2n2) n -1 II422 2E(S )_;(2.20(2.20) )進而,設XL N(怙2),由第四章2 2 (2.82.8)式知X J Xini 4也服從正態分布,于是得到以下的定理:定理一設Xi,X2,川,Xn是

21、來自正態總體N(;)的樣本,應是樣本均值,則有XL N(*2, n)對于正態總體2 _N(f)的樣本均值X和樣本方差S2,有以下兩個重要的定理定理二設Xi,X2,l山Xn是總體NC、/)的樣本,X,S2分別是樣本均值和樣本方差,則有(n -1)S22aL2(n-1)22 X與S獨立(2.21(2.21)定理的證明見本章末附錄. .定理三設X1,X2H,Xn是總體N(r2)的樣本,X,S2分別是樣本均值和樣本時,(X -Y) -(7- 叮)tgn2-2)且兩者獨立由t分布的定義知S-卩 /(n - 1)S2二;n V -2( n-1)化簡上式左邊,即得(2.222.22)式. .對于兩個正態總體

22、的樣本均值和樣本方差有以下的定理樣本的樣本方差,則有S & u F(n -1小2-1)方差,則有X -JIS沽叫1)(2.22(2.22) )證由定理一、定理二X二L N(0,1)二. nSL2(n_1)CTLt(n-1)定理四 設Xl,X2|X與丫1,丫211Yn2分別是來自正態總體N(叫,于1)與2Nd的樣本,X且這兩個樣本相互獨立. .設1 _ q1 -i=1X,二一n1n2i分別是這兩個樣本的樣本均值;S12=丄V:1(Xi-X)2丄I)2分別是這兩個且它們相互獨立,故由2分布的可加性知且它們相互獨立,故由2分布的可加性知_ _ 2 2口X- N(氣巴,二+二)2易知n1壓,即

23、有u =(x -Y)-T12)Lafnr m n2其中C2(mjs2(n2_i)s;Sw _m +n2 21由定理二2(m -1)S2-12(n2-1)S22-2L2( n1)L2(n2-1)由s2假設獨立,則由F分布的定義知(n1_ 1)S1(n2_ 1)SI5-1)/. (n2-1XF(n1-1,n2-1)N(0,1)F(n1-1n -1)且它們相互獨立,故由2分布的可加性知又由給定條件知22g -1)(J2辱金L2血-1).V = 5 -1)(n2-嚴;2缶“2-2) aa由本章附錄2知U與V相互獨立. .從而按t分布的定義知本節所介紹的幾個分布以及四個定理,在下面各章中都起著重要作用應

24、注意,它們都是在總體為正態這一基本假設下得到的小結在數理統計中往往研究有關對象的某一項數量指標,對這一數量指標進行試驗或觀察, 將試驗的全部可能的觀察值成為總體,每個觀察值稱為個體, 總體中的每一個個體是某一隨機變量x的值,因此一個總體對應一個隨機變量x. .我們將不區分總體與相應的隨機變量X,籠統稱為總體X. .隨機變量X服從什么分布,就稱總體服從什么分布在實際中遇到的總體往往是有限總體,它對應一個離散型隨機變量當總體中包含的個體的個數很大時,在理論上可以認為它是一個無限總體 我們說某種型號的燈泡壽命總體服從指數分布,是指無限總體 而言的又如我們說某一年齡段的男性兒童的身高服從正態分布,也是

25、指無限總體而言的無限總體使人們對具體事物的抽象無限總體的分布形式較為簡明,便于在數學上處理,使用方便在相同的條件下,對總體X進行n次重復的、獨立的觀察,得到n個結果XXzJllXn,稱隨機變量Xl,X2,|l(Xn為來自總體x的簡單隨機樣本,它具有了兩條性質1 1、XjXzJlIXn都與總體具有相同的分布;2 2、Xi,X2l(Xn相互獨立. .我們就是利用來自樣本的信息推斷總體,得到有關總體分布的種種結論的樣本Xi,X2l(Xn的函數g(Xi,X2l(,Xn),若不包含未知參數,則稱統計量統計量是一個隨機變量,它是完全是有樣本所確定的統計量四進行統計推斷的工具 樣本均值U*V (nin2-2)(X一丫)(叫2)Lt(nin2-2)nin2Xk和樣本方差S2是兩最重要的統計量統計量的分布稱為抽樣分布 下面是三個來自正態分布的抽樣分布:2分布,t分布,F分布這個三個分布統稱為統計學的三大分布,它們在數理統計中有著廣泛的應用對于這三個分布,要求讀者掌握它們的定義和密度函

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論