




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第6章統計量與抽樣分布
【弓I例】1899年,戈塞特(18767937)進入都柏林A.吉尼斯父子釀酒公
司擔仟釀酒化學技師,主要從事統計和實驗工作。他在工作中發現,供釀酒的
每批麥子質量相差很大,而同一批麥子中能抽樣供試驗的麥子又很少,每批樣
本在不同的溫度下做實驗,其結果相差很大。這就決定了不同批次和溫度的麥
子樣本是不相同的,不能進行樣本合并。這樣一來,實際上取得的麥子樣本,
不可能是大樣本,只能是小樣本。他在工作中還發現,利用小樣本得出的結果,
和正態分布有較大的差異,特別是兩端尾部的概率,比正態分布明顯高。因此
1907年戈塞特決心把小樣本和大樣本之間的差別搞清楚。為此,他試圖把一個
總體中的所有小樣本的平均數的分布刻畫出來。做法是;在一個大容器里放了
一批紙牌,把它們弄亂,隨機地抽若干張(小樣本),對這一樣本記錄觀察值,
然后再把紙牌弄亂,抽出幾張,對相應的樣本再記錄觀察值。大量地記錄這種
隨機抽樣的小樣本觀察值,就可以獲得小樣本觀察值的分布。1908年,戈塞特
以“學生(Student)”為筆名在《生物計量學》雜志發表了論文《平均數的規
律誤差》。這篇論文開創了小樣本統計理論的先河,為研究樣本分布理論奠定了
重要基礎。被統計學家譽為統計推斷理論發展史上的里程碑。
那么總體和樣本是如何聯系的?大樣本和小樣本下究竟有什么差異?什么
是t分布?它和正態分布有什么不同?它有什么作用?統計推斷中常用的分布
還有哪些?這些問題都將在本章中找到答案。
統計研究的目的是為了探索現象內在的數量規律性。為了解總體的數量特
征,可以直接對總體進行全面調查,得到總體數據,進而歸納出數量特征;也
可以對總體進行抽樣,利用樣本對總體進行推斷,后一種方法稱為統計推斷。
抽樣分布是進行統計推斷的理論基礎。本章將主要介紹統計推斷所涉及的總體、
樣本、統計量及抽樣分布等概念,以及在統計推斷中最常用的/分布,/分布
和產分布和抽樣分布定理。
§6.1總體與樣本的統計分布
總體與樣本是統計推斷中的兩個基本概念。統計推斷的目的是從樣本信息
出發,運用概率論的方法,推斷總體的特征;因此如何將統計學的總體、樣本
和概率論的基礎一一隨機變量與分布聯系起來,就成為統計推斷首先要解決的
問題。
§6.1.1統計推斷中的總體及總體分布
第一章中已經明確統計所研究的是由同類事物構成的總體的數量特征,總
體是根據一定的目的確定的所要研究的事物的全體,它是由客觀存在的、具有
某種共同性質的眾多個體構成的。總體中的每個單位稱為個體。比如前面引例
中,每一批麥子的全體就是一個總體,而其中每單位的麥子就是個體。這是統
計學中關于總體的概念,我們可以稱其為實物總體。
在前面章節的學習中,我們已經發現:我們真正關心和收集研究的并不是
這些總體中的個體本身,而是這些個體的某些特征及其數值,在前面我們將這
些特征用變量來描述,對應的數值稱為變量值。關心這批麥子,主要關心的是
其釀酒的效果出酒量。此時出酒量成為需要研究的變量,每單位麥子出酒量的
具體數值成為變量值。在研究這批麥子時,并不需要將全部這批麥子都收集過
來,只需要記錄這批麥子每單位出酒量的數值,再對這些數值進行研究就可以
了。此時的總體實質是這批麥子的出酒量對應的若干個數值,總體已經從實物
抽象到了數值,可以稱之為數值總體。這是對總體概念的第一次抽象。
如果實物總體中個體很多,則對應的數值總體其規模將非常大,而且往往
其中重復的值會很多,即使沒有重復值(變量取值連續時),在不同值周圍的“密
集程度”也會不相同。逐一研究每個變量值將會非常繁瑣,當總體規模趨于無
窮時,研究每個變量值更是變得不可能。若統計出變量的所有不同取值(或取
值區間)及其出現的頻率,編制變量的分布數列,則可以對變量的全部取值情
況一覽無遺。研究一個變量的全部數值,就轉化為研究該變量的分布了。用變
量及其分布來描述一個總體,可以稱之為分布總體。例如研究某批麥子的出酒
量X,這是個連續變量,可以統計出X在不同區間取值的頻率,得到X的分布。
對全部單位出酒量的數值的研究,就可轉化研究出酒量X的分布了。這是對總
體概念的第二次抽象。
對于隨機變量X,其取值是隨機的,關注該變量的全部取值,也就是要關
注其各個可能取值(或取值區間)及其相應概率,即關注該隨機變量的概率分
布。在統計推斷中利用隨機變量X及其概率分布來描述一個總體,應用起來非
常有優勢,尤其是當總體容量趨于無窮時,另外一個好處是可以利用概率論的
理論和方法來研究總體。例如麥子出酒量的總體分布如果是正態分布,就可以
利用正態分布的密度函數計算出酒量在各區間的概率。
經過上述討論,完成了從“實物總體f數值總體f分布總體”的兩次抽象,
也完成了我們將統計學中“總體”與概率論中“分布”的銜接,這是統計推斷
對總體概念的延伸,也是概率論知識應用于統計推斷的基礎。以后在本章及以
后統計推斷的相關章節中,如無特別說明,總體均表示分布總體,給定一個總
體,只需耍給出總體的分布即可。
§6.1.2統計推斷中的樣本及樣本性質
統計推斷的重要任務是通過對總體中隨機抽取的部分個體的觀測結果來推
斷總體的特征。按照隨機原則,通過觀測或試驗的方法所獲得的總體中一部分
個體的取值稱為樣本,每個個體的取值稱為樣本點或樣品。抽出樣本之前,由
于總體中各個體有同等被抽中的可能,抽中那個個體不能確定,因此樣本是一
組隨機變量,每個樣本點都可以取總體中任意一個值;但是當樣本被抽取并觀
測記錄后,若干個體被抽出,各樣本點的取值確定,樣本成為是一組確定的數
值。統計推斷中為了區分此二重性,將抽取前具有隨機性的樣本稱為樣本,用
大寫字母表示;將抽取的一組確定的數值稱為樣本觀測值,用小寫字母表示。
如要推斷某種燈泡使用壽命總體X的特征,擬隨機抽取〃只燈泡進行測試,其
使用壽命(X,X2,…,Xn)稱為燈泡使用壽命總體X的樣本,一次具體抽樣測試得
到n個燈泡使用壽命的數值(即,及,…用0,稱為總體X的樣本觀察值。
統計推斷中,把具有以下兩個重要性質的樣本稱為簡單隨機樣本:
1.樣本點與總體同分布
這一點很容易從數值總體的角度加以理解:由于采取隨機原則抽取樣本點,
每個個體被抽中的可能性相同。假設總體容量為M則每個個體被抽中的概率
為1/M假設對離散型總體取值等于x,或對連續型總體取值在區間x+/x)中
的個體總數為M,那么抽出樣本點取值為X或在區間(.%工+〃幻中的概率就是
M小,恰好等于總體X取值為x或取值在區間(x,x+ZYx)中的頻率(或概率),從
而可以看出樣本點與總體分布相同。
2.樣本點之間相互獨立
從總體中抽取樣本的方法有重復抽樣和不重復抽樣兩種。采用重復抽樣時,
每次隨機抽取一個樣本點并記錄其特征以后,又將它放回總體中參加下一次抽
取,每次抽取樣本點都是在總體的N個單位中進行的,前一次抽取的結果不會
影響后一次抽取的結果,因此樣本點之間相互獨立。采用不重復抽樣時,每次
隨機抽出一個樣本點后不再將它放回總體中,下一次只能在其余個體中抽取,
前面抽取的結果就會影響后面的抽取,因此樣本點之間不是相互獨立的。但通
常實際工作中總體容量非常大,采用不重復抽樣時也可以近似認為樣本點之間
相互獨立。對于總體容量無限的情形,無論采取重復抽樣還是不重復抽樣,都
可以認為樣本點是相互獨立的。
在本書后面的敘述中,常常將以上兩個性質一同簡寫為“樣本點獨立同分
布(讓4”。沒有特別說明的情況下,我們討論的樣本均指的是簡單隨機樣本。
§6.2統計量
§6.2.1統計量的概念
在統計推斷中,總體信息是未知的,但從總體中抽取的樣本中含有總體的
信息、,統計推斷就是利用樣本的信息來推測總體的信息。然而樣本的信息是隱
蔽的、分散的,必須經過必要的加工對樣本信息進行集中和提煉才能用來推斷
總體信息,構造樣本統計量是集中和提煉樣本信息來推斷總體信息的有效手段
之一。
設(X1….,X〃)是來自總體X的一個樣本,如果T=T(X1,X2,…,X“)是
樣本(X1,…,X")的函數,7中不含任何未知參數,則稱T(X1,X2,…,X“)為
一個統計量。如果(芭,…,x“)為樣本(X1,…,X〃)的觀測值,則
T=7(4工2,…,G為統計量7=nxPx2,…,X“)的觀測值。統計量的觀測
值是確定的,沒有隨機性。
統計量有以下兩個特征:統計量是樣本的函數,統計量通常為隨機變量;
統計量不能含有未知的參數。例如,當從正態總體中抽出樣本“時,
考查隨機變量£(Xj-4)2,當總體均值〃為已知時,該變量是統計量;當
/=|
總體均值未知時,該變量就不是統計量。
統計量既然是隨磯變量,那么它應該有概承分布,統計量的分布稱為抽樣
分布。抽樣分布和統計推斷有著密切的聯系。統計量明確以后,必須要知道其
抽樣分布才能在統計推斷中使用,因為只有知道了統計量的分布,才能利用概
率論對總體的特征進行推斷,并得到相應的推斷置信度。所以在統計推斷中,
一項重要的工作就是尋找統計量和導出統計量的抽樣分布或漸近抽樣分布。
【例6-1】總體X股從兩點分布,概率分布律如下:
p(x=1)=p,P(X=O)=1—〃
從總體中抽取容量為〃的樣本,構造統計量T=ZX,.,求此統計量的分布。
z=i
解:由于樣本是犯立的,X,服從兩點分布:統計量7為隨機變量,其取
值是。到〃之間的所有整數,其分布恰好是二項分布:
P(T=k)=C:pA(1—p)"-k,A=0,1,2,〃
從上面的例子中,可以看出抽樣分布未必與總體的分布一致。
【例6-2】總體分布為X?N(l,l),抽取容量為〃的樣本,構造如下三個統
計量:T=7;=X1+X2和7;=又求此三個統計量的抽樣分
n,=i
布。
解:由于樣本是獨立的,X,服從均值和方差都為1的正態分布,三個統計
量都是樣本的線性函數,由正態分布的性質,三個統計量仍服從正態分布,下
面分別求解其均值和方差:
£(7;)=£(%,)=1,D(7;)=D(X)=1
E(T2)=E(X])+E(X2)=2,D(T2)=£>(.)+O(X2)=2
1n1n1
磯()=—ZE(X,)=I,o(t)==£Q(X,)=—
nz=iri=i〃
由上面計算可以得出,統計量7;服從均值和方差都為1的正態分布,這和
總體的分布相同;統計量7;服從均值和方差都為2的正態分布,而統計量7;服
從均值為1,方差為//力的正態分布。
§6.2.2常用統計
1.樣本均值和樣本方差
設X,X2,…,x”是總體x中抽出的簡單隨機樣本,則樣本均值為
x=-Yxif樣本方差為
2.樣本矩
稱&為樣本的原點矩,稱紇=-y(xz-xV為樣本的中心
〃,=1〃/=1
矩。特別當%=2時,&Xj—又『稱為樣本的未修正方差,常記S;,
〃,=1
,常用統計量還包括樣本相關系數,我們將在第9章介紹。
顯然有S;二(TDS2。
n
3.順序統計量
設X1,丫?.?,*“是總體乂中抽出的簡單隨機樣本,把樣本點排序為
X⑴<X(2)<???<X(“),則稱X⑴,X(2),?一X。為順序統計量,其中X⑵稱為
第i個順序統計量。基于順序統計量計算的常用統計量有:
最大順序統計量X(n)=max{X19X2,...,X3}和最小順序統計量
乂⑴=min{X],X2,...,X3};
樣本極差R=X(〃)—X⑴;
也)〃為奇數
樣本中位數也=X,、+x,、
上~劌〃為偶數
2
樣本的P分位數Mp=*必+(〃+l)(p_嚕)%則「*必)
其中[〃〃]為不超過秋的最大整數:
1n-k
樣本的切尾均值Tnk=-------VX(>0<k<n9樣本的切尾均值是分別
〃-23士⑴
去掉k個最小的和k個最大的觀測值后得到的均值。
§6.3抽樣分布及抽樣分布定理
為了在正態分布假定下,得到樣本統計量的精確分布,本節需要討論幾個
十分重要的隨機變量函數的分布,它們是力2分布、,分布和尸分布。在此基礎
上討論抽樣分布的重要定理。
§6.3.1%?分布
分布是海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)分別于1875年
和1890年提出的,是統計推斷中的重要分布。它主要應用于對總體方差的估計
或檢驗以及對總體概率密度函數的檢驗等。
1./分布的定義及其密度函數
定義6-1若隨機變量X?..,X〃獨立且同標準正態分布N(O,1),則它們
的平方和
(6.1)
?=1
服從自由度為〃的/分布,記為?/(〃)。
/=i
根據服從卡方分布隨機變量的定義,我們可以根據求隨機變量函數的概率
分布的方法求出Z2分布的概率密度函數I。如果隨機變量X服從自由度為〃的
72分布,其概率密度為:
1J上
22
--n-----xex>0
22r(-)(6.2)
0x<0
其中「(〃)為gamma函數。
2.%?分布的性質特征
(1)/分布的數學期望與方差
若X服從自由度為〃的了?分布,其數學期望和方差分別為
E(X)=n,Z)(X)=2/z(6.3)
可見隨著自由度的增大,/分布的期望和方差隨之增大,自由度決定了
力2分布的形狀。從密度函數定義可以看出,/分布是一種不對稱偏峰分布,
其取值區域為(0,+8);隨著自由度的逐漸增大,%?分布曲線的最高點逐漸下
降并向右移動,分布曲線趨于對稱,如圖6-1所示。
1推導過程略,有興趣的讀者可以參考陳希孺,《數理統計引論》,高教出版社
P{^2(n)>^(n)}=a
關于22分布上側。分位數/5)可以通過書后附表求得,附表給出了自
由度〃V45的分布上側a分位數。也可通過EXCEL的CH1NV函數求得。
例如/必(11)=2.603,若。(13)=27.688。
(2)分布的自由度
力2分布中〃稱為自由度。對于變量X-…,X〃,如果存在一組不全為零的
常數c“2…?,%,使得C1X+C2X2+…+c〃X”=0成立,則稱變量
之間存在一個線性約束條件。如果變量X,..,X〃中存在攵個獨立的線性約束
條件,則Xj(i=l,2,…,〃)中獨立變量的個數為(〃一2),稱它為自由度。自由
度也可粗略解釋為可以自由選擇數值的變量個數。
例如,fx;由〃個獨立的隨機變量X構成,由于它們之間沒有線性約
;=1
束條件(即Z=0),所以它的自由度為〃。£(Xj—廿2的自由度為(〃_]),
/=1
這是因為計算£(x廠區)2時要用又,又滿足限制條件£。「區)=0,即
<=1/=1
相對于反的〃個離差變量(X1-又),(X2-又),…,(X〃一刀),只有(〃一1)個可
以任意確定,第〃個失去了“自由”,所以能其自由度為(〃—1)。
(3)/分布的可加性
若x、y相互獨立,且分別服從自由度為陽、%的?2分布,則x+y服
從自由度為々+”的?2分布,即
x+y?/(4+〃2)
【例6-3]設X]….,乂6是獨立同服從N(0,2)分布的隨機變量,求a,b
22
和c使+b(X2+X3)+c(X4+X5+X6)服從/分布。
因為….,X6獨立同N(0,2)分布,所以
則至從而;
X~N(0,2),~N(O,1),
VV1
X2+X3-/V(o,4),則\3?Q(O,1),從而z(X?+X3)2?72(1)
X+X+X
X+X+X^7V(0,6),則^~~~N(O,1),從而
4S6瓜
22
1(X4+X5+X6)-Z(1)O
o
由于42分布的可加性,則
2222
-X,+-(X2+X3)+-(X4+X5+X6)^^(3),自由度為3。且
ci=-,b=一和。=—o
246
§6.3.2亡分布
,分布又稱為“學生分布”,是統計推斷中的重要分布。它在總體均值的估
計與檢驗、相關與回歸分析等方面有著廣泛的應用。
Lf分布的定義及其密度函數
定義6-2若隨機變量X~N(O,1),隨機變量Y?z2(n),且隨機變量X與
丫相互獨立,則隨機變量
X
(6.4)
F77
服從自由度為〃的,分布,記為,??〃)。
f分布的概率密度函數比較夏雜。如果隨機變量X服從自由度為〃的/分布,
則其概率密度函數為
I_?+1
/(X)=-------------(1+—)2-00<%<00(6.5)
觀察/分布的概率密度函數,可以發現它是偶函數,所以/分布是關于原點
對稱的,這一點和分布是不同的,卻和標準正態分布相似。圖6-2的三條曲
線分別是標準正態曲線以及自由度為19和5的/分布曲線。
通過比較可以發現/分布和標準正態分布類似,都是對稱分布,均在
-8<工<8上取值。但是/分布與標準正態分布也有區別,,分布尾部厚,即服
從t分布的隨機變量取到尾部值的概率比標準正態分布略大。而對于接近原點
的坐標點,f分布密度函數的值比標準正態分布密度函數的值小。因而/分布曲
線尾部厚于標準正態分布,而峰低于標準正態分布。
滿足尸{,(〃)>ta(九)}=。的%⑺稱為自由度為n的f分布上側a分位數。
關于,分布上側a分位數%(〃)可以通過書后附表求得,附表給出了自由度
〃工45的1分布上側a分位數。例如a5(1°)=1?8125,由于,分布是定稱分
布,所以九95(1°)=一1?8125。
2.t分布的性質特征
(1)/分布的數學期望與方差
[分布的數學期望與方差分別是
E(r)=O,。(/)=〃/(〃-2)n>2(6.6)
由于/分布是對稱分布,其數學期望當然為0。雋要注意的是:只有當自由
度大于1,其數學期望才為0,自由度為1時,數學期望不存在;同時注意到/分
布的方差與其自由度有關,自由度小于等于2時,方差不存在,當自由度
〃―8,方差極限為lo
(2)/分布的自由度
f分布的自由度是由生成/分布的分母即卡方分布隨機變量的自由度而來。
1分布的形狀和自由度〃有較大關系,自由度越小,f分布曲線與標準正態分布
曲線的區別越明顯,,分布“比較平”,而自由度增大,1分布曲線與標準正態分
布曲線的差異逐漸縮小。這一點也可以由f分布的方差來說明,當自由度〃較小
時,/分布的方差較大,此時其分布就“比較平”;而當自由度較大時,方差較
小,而月越來越接近1.此時/分布與標準正態分布逐漸接近C
【例6-4】設X”..,X6是獨立同服從N(0,2)分布的隨機變量,如果隨機
Y
變量c/力服從自由度為5的I分布,求c等于多少。
因為X,.?,X6獨立同服從服(0,2)分布,所以
v
X「N(0,2),則2=方~陽0,1)。
Y2丫2Y2Y2丫2
又因為%2=&_&+工+工+工?2(5)
22222
而Z與%?相互獨立,則由/分布的構造,有
醫+9+星+應+巡/5
V22222
J(X;+X;+X:+X;+X;)/5
所以
§6.3.3廠分布
產分布是統計學家費雪(R.A.Fisher)于1924年提出的,尸分布在假設檢
驗、總體方差的統計推斷、方差分析、回歸分析和多元統計分析等方面有著廣
泛的應用。
1.尸分布的定義及其密度函數
定義6?3若隨機變量X、y分別服從自由度為〃1、%的卡方分布,且X、
y相互獨立,則隨機變量
F=*(6.7)
Y/n2
服從第一自由度為勺,第二自由度為%的尸分布,記為尸?尸(勺,4)。
從戶分布的定義可以看出,尸分布是兩個獨立的卡方分布隨機變量與其各
自自由度商的比值,因而產分布具有兩個自由度,作為分子的卡方分布隨機變
量的自由度稱為第一自由度,作為分母的卡方分布隨機變量的自由度稱為第二
自由度。
產分布的密度函數比較復雜,若隨機變量/服從笫一自由度為々,第二自
由度為々的“分布,那么其密度函數為:
「(工
〃產〃2
22x>0
/(0=,吟(6.8)
0x<0
如圖6-3所示,尸分布曲線有些類似于卡方分布,也是一種非對稱的正偏
分布。其值域為(0,+8),但它有兩個自由度修和〃2。尸分布的分布曲線隨著
兩個自由度的不同組合而不同。兩個自由度的不同組合形成廠分布曲線的不同
形態,這在尸分布的圖形中可清楚看到。隨著第一自由度小的增大,分布曲線
逐漸趨向對稱,隨著兩個自由度的增大,分布曲線逐漸趨于正態分布。
0.8
滿足pS(〃],%)2乙(〃|,〃2))=二的心(〃|,〃2)稱為自由度為〃的F分布
上側。分位數。由于F分布有兩個自由度,所以附表僅僅給出了某些較小。值
對應的外(勺〃2)值。例如a05(20,30)=1.93。對于任意的。和自由度,其分
位數都可通過EXCEL的FINV函數求得。
2.尸分布的性質特征
(1)產分布的數學期望和方差
F分布的數學期望和方差分別為
E(F)(%>2)
(6.9)
2片(勺+&-2)
D(F)=(%>4)
452—2)2(〃2—4)
從方分布的均值和方差表達式可以看出,隨著第二自由度公增大,尸分布
的均值趨于1,而方差則取決于兩個自由度。
(2)尸分布的自由度
廠分布的自由度是由構造F分布的分子和分母的兩個z2分布的自由度而
來,由于其分子和分母的分布可以交換,所以尸分布的兩個自由度有一個
重要性質,就是它們是可以互相轉化的。
若F?尸(公氏),則1/F?。這個重要性質對于查尸分布求大。
的分位數提供了方便:
U,%)=工;----7(6.10)
工(乙,4)
【例6?5】給定顯著水平。=0.95,查尸(15,20)的a上側分位點。
因為一般F分布表并未給出a=0.95的上側分位點。則要根據F分布的性
質,首先查乙05(20,15)=2.328,根據公式(6.9)可求得:
與95(15,20)=熹=0.4296
也可以通過EXCEL的統計函數功能中的函數FINV直接計算該分位數L
調出EXCEL的函數£,選中函數FINV,根據對話框輸入相關信息即可。FINV
的對話框如圖6-4所示。
圖6-4EXCEL的函數FINV的對話框
§6.3.4抽樣分布定理
下面討論總體為正態分布時樣本統計量的抽樣分布。這是因為在實際應用
中許多總體分布或是正態分布,或是近似可以認為是正態的。即使總體分布非
正態,由中心極限定理可知,大樣本下,樣本均值的分布也可以近似認為是正
態分布。
定理6-1若〃是從總體N(〃,b2)抽取的一個簡單隨機樣本,則
有:
-(y2
1.X?N(〃,一)(6.11)
n
1%?分布和,分布的百分位點,也可分別通過EXCEL的統計函數CHINV和TINV得到。
(6.12)
期X,-方(〃.」或
?/(〃T)(6.13)
3.樣本均值X與樣本方差52相互獨立?o
其中又號,心上出廠對。
【例6-6]在正態總體NO/,。?)中抽出一個容量為25的樣本,
125_
S2=—£(Xj-刀產為樣本方差,這里〃和,均為未知。求
24/=|
(1)當b=2.3時,求P(|又一〃區1);
c2
(2)P(0.577<—<1,5173);
CT~
(3)D(S2);
2
解:(1)因為反?N(〃J),所以當。=2.3,"二25時有:
n
P(|X-//|<1)
X—〃1
=P(\2.3/后區2.3/后)
=P(|Z|<2.174)=2P(Z<2.174)-1=2X0.985-1=0.97
(2)因為樣本來自于總體樣本容量〃=25,所以
(n-l)52(25-1)52
z2?八24)
(72(J2
92
則^(0.577<^-<1.5173)
24s2
=P(0.577x24<<1.5173x24)
=P(0.577x244/(24)41.5173x24)
=尸(13.848</(24)<36.415)
=P(Z2(24)>13.848)-P(Z2(24)>36.415)
=0.95-0.05=0.90(查斤2分布表得出)
i定理證明略,讀者可以參看的詩松等著《概率論與數理統計》。
24s2
因為(,所以由式()可知:。(/())。
(3)/24)=96.324=48
而。&)=唱等)
444
__p(z2(24))=__x48=,
定理6?2若總體服從從中抽取容量為〃的樣本XI….,X?,則
t=(6.14)
S/y/n
證明:樣本XI,...,X“相互獨立,且都服從NT。?),由公式(6.12)和
(6.13)有:
Z=j一〃?N(0,1)
/no7n
(-1)S2
和~~2
而且隨機變量z與y相互獨立。結合?分布的定義有:
z又一〃V^Tcr_X-JLI
=川川(〃-西=^^()
即/(〃-1)
【例6-7]設總體X服從正態分布NT。?),X1,…,X〃,X?1是來自
2
總體的一個樣本,記》=一£Xi和s?=——y(xz.-x),試求
〃9〃-1言
Y_y
向“的分布。
S
由于X1,…,X”,X向來自總體N(〃Q2)的簡單隨機樣本,則分別有
2
?N(4,〃)和兄?N(〃,——),且X,和Xfl相互獨立,則
nJ+1
(
X,I+I-又"?N(0,四/),且z=X「%~N0』)。
n"十12
Vn
2
因為72二%二比?,2(〃一]),而且根據定理6/的結論有Z和7?相互獨
立,所以
nX.-Xn
?r(n-l)o
〃+1S
定理6?3若總體X服從N(4,b:),總體y服從N(4,b;),且兩個總體
相互獨立。從兩總體中分別抽取容量為4和%的樣本X,.X/和幾...,小。
(2)當b;=b;,貝IJ
f_又-丫-(內-%)
I-1?/(4+H-,—2)(6.16)
11
S”,—+——
用%
(々-l)S;+(〃2-l)S;
其中S“工
nA+%—2
i.i.di.i.d
證明:(1)因為X1,…,X,,~N(wd),幾…?N("?,6),并且
兩組樣本是相互獨立的。所以
1~N(內,6g,一~N(-2/%)
并且又和「相互獨立,從而
反一歹_(4_從)?N(0,互+貢)
勺%
則z=又一;一(從二小)
?N(0,l)。
?7
0-+%
V勺%
(2)因為由(6.12)式可以得到:
(H.-D5,2(叫一1局
~/(4-1),~/(%一1)
22
旦S:和S;相互獨立,從而
Z=,十一,一?=5]+%—2)
bb
并且(1)中的Z和上述/相互獨立。根據t分布定義并化簡可得
ZX—Y—(//1—//)
,=/,=---1:二0-?5+%一2)
Jr/(%+%-2)s,十_L
所以,上述變量服從自由度為“+%-2的,分布。
定理6-4若總體X?N(月,端),另一總體y?N("2,b;),從第一總體
中抽取容量為々的樣本,從第二個總體中抽取容量為小的樣本,兩個總體是獨
立的,則變量
(6.17)
證明:因為樣本相互獨立且和總體具有相同的分布,所以
i.i.d
X],…,X%~N(〃0:)
i.i.d
加…,工?Ngj
由前面定理6-13,
7(〃1—1)S:2/八
石=I2H/T)
0
9(%—i)s;[、
2?萬(D
兩個總體相互獨立,所以隨機變量力:和%;相互獨立,從而
產二//―2/b:
?F(%
//(均一1)s;/8
所以該隨機變量服從第一自由度為第二自由度為&-1的〃分布。
本章小結
I.總體可抽象為所感興趣的變量及其取值的分布。通過觀測或試驗的方法
獲得的總體中一部分個體稱為樣本,樣本中每個個體稱為樣本點。
2.統計量是樣本(X1,…,X〃)的函數且不含任何未知參數。在統計推斷問
題中,經常需要利用取自總體的樣本構造出合適的統計量,并使其服從或
漸進地服從已知的分布。常用統計量有樣本均值和方差等。統計量的分布
為抽樣分布。
3.在正態分布假定下三種常用分布——7?分布、t分布和F分布。本章介
紹了三種分布的定義、構造原理和重要性質,以及相應分位數的含義和計算方
法。
4.本章介紹了抽樣分布理論中的幾個重要定理。它們是對正態總體的均
值、方差等參數進行統計推斷的重要理論基礎。
基本知識梳理
基本知識點含義或公式
總體指所研究事物的全體(實物總體),或指所研究事物在某個特征上
的取值的全體(數值總體)。
樣本按照隨機原則從總體中抽出的n個個體。簡單隨機樣本的性質:
(1)樣本點和總體具有相同的分布
(2)樣本點之間是獨立的
統計量丁二/以不,….)是樣本的函數,如果丁中不含任何未知
參數,則稱7(%,兀,.../〃)為一個統計量。常用統計量有:樣本均值
和樣本方差、樣本矩統計量、樣本相關函數、樣本的順序統計量。
抽樣分布統計量的分布稱為抽樣分布,常用的抽樣分布有/分布、,分布、F
分布。
分布目互獨立的且服從標準正態分布,則它們的平方和服從自
由度為n的/分布,即為X;?#2(〃)。
z=l
/2分布的性自由度為n的/分布變量,均值和方差分別為n和2n;隨自由度的增加,
質/分布趨近正態分布;獨”42分布變量具有可加性。
自由度自由度也可粗略解釋為可以自由選擇數值的變量個數,即變量的總
個數減去線性約束的個數。
1分布x,y相互獨立;X~N(O,1),y~/(〃);X即服從自由度為〃
x/r/n
的,分布,即?/(〃)。
y/yTn
,分布的性質均值E(f)=0,方差。⑺=〃/(〃—2);/分布的自由度和分母中y
的自由度相同;(分布曲線比標準正態曲線低峰厚尾,隨自由度的
增加,/分布趨近標準正態分布。
F分布X)相互獨立;X~/(4),y~/2(%);F=X'即服從第一自由
~Y/n2
度為勺,第二自由度為%的尸分布,即尸=泮?A%%)。
產分布的性質產分布的均值隨著第一自由度&增大而趨于1,方差則取決于兩個
自由度;若尸?尸(勺,2),則//~F(%,〃i)。
在正態總體的假定條件下,有
抽樣分布重X—N入T/八(?-1)522/1、
要定理r-~N(0/),、~/51),
o/<nb
;x_y”i2)_(_2)
依正一
練習題
一、單項選擇題(在4個備選答案中選擇1個正確答案)
1.某產品出廠檢驗規定:次品率〃不超過4%才能出廠,現從一1批產品中抽取
12件進行檢查,假設取值為1代表次品,取值為0代表合格品,則數值總體是
()
A.OB.lC.0和1D.許多取值為0或1的數的全體
2.某廠生產的螺絲釘,其標準長度為6.8,而其真實的長度X?N(〃,0.36),
從上述敘述中,假設總體均值就是標準長度,從生產的螺絲釘中抽取了1個螺
絲釘作為樣本,其長度為6.7mm,則該樣本X1的分布是()
A.P(X\=6.7)=1B.N(6.8,0.36)C.N(6.7,0.36)D.U(6.7,6.8)
3.樣本和樣本觀測值的關系是()
A.兩者都是隨機變量,分布相同B.兩者都是隨機變量,但分布不同
C.樣本觀測值是樣本的一次實現D.樣本只能取樣本觀測值
4.設總體服從參數4的Poisson分布,從總體中抽取〃個樣本,樣本的聯合分
布為()
n
%心
A--"叱七=0』,...B./E(1-A)1=1
在中
;=1
C.—e,xi=0,1,...D.以上都不對
xi!
5.以下不是統計量是()
A.樣本均值B.樣本方差C.樣本極差D.樣本量
6.設總體X?N(0J),從總體中抽取〃個樣本,下列統計量中不服從療分布的
是()
A豈X;B.X;十X;C.(X]+X2)>+(乂3+乂力D.(X1+%2)
i=\2
7.設總體X服從自由度為3的/分布,從總體中抽取〃個樣本,下列統計量
服從自由度為9的卡方分布的是()
22
A.(X[+X2)+(X3+X4)B.X;+X;+X;
C.X]+X、+X3D.(X]+X、+X?)2
8.比較標準正態分布和自由度為5的/分布的0.05分位數Z0o5和foos(5),可
以得到()
A.Zo,05<,0.05(5)B.Zoo5>ho5⑸C.Z)05=,o.O5⑸D.不能比較
9.假設獨立總體X和y都服從標準正態分布,從兩個總體中分別抽取10個和
15個樣本,則下列說法中,正確的是()
10
A.Z(X4工.)2服從自由度為10的/分布
/=1
B.fx;服從自由度為14的/分布
1510
C-ZX/2/Z^2服從自由度為15和10的〃分布
/=1;=1
1510
D.2Z甲/?ZX;)服從自由度為15和10的r分布
/=i;=1
10.根據抽樣分布重要定理,以下結論錯誤的是()
A.X服從正態分布B.f(X,—X)2服從自由度為(n-1)的二分布
/=1
C.r=?,(〃一1)D.F=?0,巧-1)
二、多項選擇題(在5個備選答案中選擇2-5個正確答案)
1.設X,..,X〃表示從總體X中抽出的樣本,與表示樣本觀測值,總體
的均值〃和標準差。都是未知的,以下是統計量的有()
A.X,B.XC.£(Xj—“)2D.fx:+5E.x_
*=1i=l
2.設總體x是標準正態分布,X'…,X”表示從總體中抽出的樣本,以下統
計量中,服從自由度為1的/分布的有()
2
9(>X.))
2B(k+Xjc臺DrJX+X/f2
A?X1Jo?YJ?IJu*?/y\.?
'2n2白’
3.假設總體X是標準正態分布,用X1….,X〃+:表示從總體中抽出的樣本,以
下統計量中,服從自由度為1的,分布的有()
X,X1+X“X+X,+X?yiX)
得|夜xV3|X4|版氏/Jx:+x;
4.假設獨立總體X.Y是標準正態分布,用X”…,X“,X….,工表示從總體
中抽出的兩個樣本,以下統計量中,服從尸分布的有()
X:+片x;+y2(n-DXr
A.X;/『B.C.~D.E.
X:2X:*2fx;
i=2
5.正態總體的抽樣分布定理和統計量,以下說法正確的是()
A.樣本均值的分布是正態分布
B.當總體方差未知時,不能用正態分布對總體均值進行推斷
C.當兩個獨立總體方差己知時,應該用/分布對均值的差異進行推斷
D.當兩個獨立總體方差未知且相等時,可以用,分布對均值差異進行推斷
E.可以用/分布統計量對兩個獨立總體的方差是否相等進行推斷
三、判斷分析題
1.樣本點是相互獨立的,并且和總體具有同一分布。
2.因為/具有可加性,所以/分布也具有可加性。
3.,分布隨機變量的平方服從產分布。
四、簡答題
1.什么叫抽樣分布?為什么要研究抽樣分布?
2./(勺,乙)和廠(他,勺)的百分位點有什么關系?
3.統計量的定義是什么?樣本點是不是統計量?
4.為什么說標準正態分布是抽樣分布理論的重耍基礎?
五、計算題
1.假設(X「…,X?)是來自總體的一個樣本,當總體服從以下分布時,求
出樣本均值》的抽樣分布:(1)X?P(㈤(2)X-r(m)
2
2.查表計算下列分位數:(1)I。)。,為,/(5)0,05;(2)Z(10)(X975,/(⑼。.^,
(3)%75(12,10)
O
3,分別從方差為20和35的兩正態總體中抽取容量為8和9的兩個獨立樣
本,(%…(匕試計算P(S:>2S;)。
4.設(X,..,X〃,X用…是來自正態總體N(0,/)的樣本,試求
下列統計量的分布
而力X,
忐X;
(1)i=l
Y=——產n+m°
心x;
V/=/?+1/=/?+!
第6章抽樣分布參考答案
一、單選題
1~5:DBCAD;6~10:CCADBo
二、多選題
1.ABCDE;2.ABD;3.ABC;4.ACD;5.ADE;6.ADE。
三、判斷分析題
1.正確,在統計推斷口,假設總體是無限總體,因而無論采用何種抽樣方式,
樣本都是相互獨立的,樣本與總體的同分布性是由樣本抽樣時的隨機原則決定
的。
2.錯誤,,分布不具有可加性,假設有兩個獨立的,統計量,自由度分別為,〃
vV
和小則根據/分布的構造,。=———小=——ro即使假定x,y,*S2
S、7mS2/\Jn
cy_i_cv
相互獨立,t.+t2=-=——7^=,通分計算后分子不再服從卡方分布
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 外部資源評估協議
- 珠寶展售保證金合同
- 玉米種植農業生產組織形式與創新考核試卷
- 櫥柜安裝承包協議
- 耐火材料在電力行業的應用案例考核試卷
- 真空泵在環保工程中的應用考核試卷
- 稀土金屬壓延加工的產業協同創新機制探討考核試卷
- 有色金屬礦山生態環境評價與保護考核試卷
- 體育用品生產自動化與智能制造考核試卷
- 稀有金屬礦選礦廠產品質量安全管理與追溯考核試卷
- 小學三年級數學兩位數乘兩位數筆算能力測驗練習題
- 心理發展與教育智慧樹知到期末考試答案章節答案2024年浙江師范大學
- MOOC 國情分析與商業設計-暨南大學 中國大學慕課答案
- MOOC 大學體育-華中科技大學 中國大學慕課答案
- 《光伏發電工程工程量清單計價規范》
- 國家衛生部《綜合醫院分級管理標準》
- DB64++1996-2024+燃煤電廠大氣污染物排放標準
- 初中八年級數學課件-最短路徑-將軍飲馬問題
- 信息論與編碼期末考試題(全套)
- 醫院醫學倫理審查委員會章程
- 房地產銷售價格優惠申請表-
評論
0/150
提交評論