數理統計課件:抽樣分布_第1頁
數理統計課件:抽樣分布_第2頁
數理統計課件:抽樣分布_第3頁
數理統計課件:抽樣分布_第4頁
數理統計課件:抽樣分布_第5頁
已閱讀5頁,還剩194頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

抽樣分布及若干預備知識2.1抽樣分布的概念2.2三大分布和分位數2.3抽樣分布定理

抽樣分布2.4指數族2.5充分統計量2.6完備統計量2.1抽樣分布的概念統計量是樣本X1,X2,…,Xn的函數,而樣本X1,X2,…,Xn又是隨機變量,故統計量也是隨機變量,統計量的分布稱為“抽樣分布”.用樣本對總體進行統計推斷的做法如下首先,根據需要研究的總體特性,構造包含這個總體特性信息的統計量;然后,求出統計量的分布即抽樣分布,并由此給出統計推斷的結論或解釋.研究統計量的性質和評價一個統計推斷的優良性,取決于抽樣分布的性質,確定統計量的抽樣分布是數理統計的一個基本問題.近代統計學的創始人之一,英國統計學家費歇(R.A.Fisher)把抽樣分布、參數估計和假設檢驗列為統計推斷的三個中心內容.因此尋求抽樣分布的理論和方法很重要.抽樣分布精確分布極限分布(漸近分布)當總體分布類型已知,若對于任一自然數n,都能導出統計量T分布的表達式,這種分布稱為T的精確抽樣分布.說明1:能求出統計量精確分布的情形不多.已知的精確分布大多是在正態分布條件下得到.說明2:有些情形下雖然能求出統計量的精確分布,但是其表達式太復雜,使用不便;更多情形下,統計量的精確分布很難求出.精確抽樣分布當樣本容量n趨于無窮時,統計量T的分布稱為極限分布.極限分布說明:只要樣本容量足夠大,且極限分布的形式比較簡單,可以用統計量的極限分布作為其精確分布的近似.例2.1.1設X1,X2,…,Xn是來自兩點分布總體B(1,p),0<p<1的樣本,即P{X1=1}=p,P{X1=0}=1–p,求的分布.

解:由于因此例2.1.2設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,求的抽樣分布.

解:因為,其特征函數為而X1,X2,…,Xn相互獨立,根據特征函數的性質得到的特征函數為因此例2.1.3設X1,X2,…,Xn是來自總體X的樣本,且X的分布函數為F(x),(

X(1),X(2),…,X

(n))

是其順序統計量,則對1≤r≤n,X

(r)的分布函數為若總體X為連續型且有密度函數f(x)

,則X

(r)也有密度函數為因為記則證明:這一事件的概率可用二項分布B(n,F(x))表示,因此于是有利用恒等式可知若總體X為連續型且有密度函數f(x)

,則X

(r)也有密度函數為特別當r=1時,得最小順序統計量X(1)的分布函數和密度函數分別為特別當r=n時,得最大順序統計量X(n)的分布函數和密度函數分別為例2.1.4設X1,X2,…,Xn是來自均勻分布總體U[0,

]的樣本,求X

(1),X

(n)的密度函數解:X

1的分布函數為X

1的密度函數為因此,X(1)的密度函數為X(n)的密度函數為作業:習題2.1:2,4,6,72.2三大分布和分位數記做

ξ

所服從的分布稱為自由度為

n

的χ2分布.其中

n為獨立隨機變量的個數.1定義2.2.1(χ

2分布):設X1,X2,…,Xn

獨立同分布,

且都服從標準正態分布N(0,1),令則稱隨機變量ξ

是自由度為n的χ2變量.2.2.1

χ

2分布來定義.其中伽瑪函數通過積分設隨機變量,則ξ

的密度函數為2定理2.2.1(χ

2分布的密度函數)

的聯合密度函數為的分布函數為當x>0時,證明:作球坐標變換

令令當x>0時,當x≤0時,因此,ξ

的密度函數為特別,當n=2時,其密度函數為是數學期望為2的指數分布.下圖畫出了n=1,4,10,20幾種不同自由度的χ2分布的密度函數的圖形.說明1.χ2(n)的密度函數的支撐集(使密度函數為正的自變量的集合)是(0,+∞);

2.當自由度n

越大,χ2(n)的密度函數的曲線越趨于對稱,且

根據中心極限定理趨于正態分布;3.當自由度n

越小,χ2(n)的密度函數的曲線越不對稱.性質1:

,則

3χ2分布的性質E(ξ)=n,D(ξ)=2n.(2)ξ

的數學期望和方差分別為(1)ξ

的特征函數為證明:(1)由特征函數定義,得其中

X1,X2,…,Xn獨立同分布,且X1~N(0,1),則(2)法一:定義法法二:特征函數法由于因此χ2分布的可加性(再生性)證明:由χ2分布的定義知:其中,Ui~N(0,1),i=1,2,…,n1,且相互獨立Vj~N(0,1)

,

j=1,2

,…,n2,且相互獨立又由于X1,X2相互獨立,得Ui

與Vj獨立同分布,均服從N(0,1)因此性質2(可加性):設且X1與X2相互獨立,則法一:定義法法二:特征函數法由性質1,得X1,X2的特征函數分別為因為,X1,X2相互獨立,因此,X1+X2的特征函數是由特征函數和分布函數相互唯一確定,得X1+X2也服從卡方分布,自由度為n1+n2推廣例2.2.1設總體X~N(0,1),X1,X2,…,X6為來自總體X的樣本,記X1+X2

+X3~N(0,3),X4+X5

+X6~N(0,3)

由于X1,X2,…,X6獨立同分布,且都服從N(0,1),因此因此c=1/3.解:試確定常數c,使cY

服從χ2分布.相互獨立其中α>0為形狀參數,λ>0為尺度參數,則稱X服從參數為(α,λ)的伽瑪(Gamma)分布,記作X~

Ga(α,λ).伽瑪(Gamma)分布Ga(α

,λ)如果

X的密度函數是是數學期望為1/λ的指數分布.1.當α=1時,Ga(1,λ)

的密度函數為說明2.如果α=n/2,λ=1/2,其中n為自然數,則有是自由度n的χ2分布.記做T~t(n).其分布稱為自由度為n的t分布.t分布又稱學生氏(student)分布.為自由度為n的t變量.2.2.2

t分布1定義2.2.2(t分布)設隨機變量X~N(0,1),Y~χ2(n),且X與Y相互獨立,則稱隨機變量(X,Y)的聯合密度函數為2定理2.2.2設隨機變量T~t

(n),則T的密度函數為證明:則令該變換的雅可比行列式為因此,(T,U)的聯合密度函數為T的密度函數為:下圖畫出了n=2,5兩種不同自由度的t分布的密度函數的圖形.3t分布的性質性質1:

t分布的密度函數關于y軸對稱,且性質2:

t分布的密度函數曲線形狀是中間高,兩邊低,左右對稱,與標準正態分布的密度函數圖像類似,且

t(2)與N(0,1)的密度函數曲線的對比對于較小的n,t分布與N(0,1)分布相差很大.

t

分布與標準正態分布的一個重要區別是:在尾部t分布比標準正態分布有更大的概率.

t(20)與N(0,1)的密度函數曲線的對比當n充分大時,t

分布近似N(0,1)分布.特別地設T~t(n)

數學期望為:當n>1時,

E(T)=0方差為:當n>2時

,D(T)=n/(n-2)性質3:證明:因此性質4:當n=1時,其密度函數為此時,t分布就是柯西分布,其數學期望不存在.例2.2.2設總體X與總體Y相互獨立,且X~N(0,16),Y~N(0,9),X1,X2,…,X9

Y1,Y2,…,Y16

分別是來自總體X與總體

Y的樣本,

求統計量所服從的分布.解:X1+X2

+…+X9~N(0,144)

且上述兩個隨機變量相互獨立,因此且上述兩個隨機變量相互獨立,因此根據t分布的定義得到其所服從的分布稱為F分布,記做為自由度為m和n的F變量.2.2.3

F分布1定義2.2.3(F分布)設隨機變量,且X與Y相互獨立,則稱隨機變量其中m稱為第一自由度,n稱為第二自由度.2定理2.2.3設隨機變量F~F(m,n)

,則F的密度函數為證明:(X,Y)的聯合密度函數為令則該變換的雅可比行列式為于是(U,V)的聯合密度函數為U的密度函數為因此F的密度函數為下圖畫出了幾種不同自由度的F

分布的密度函數的圖形.思考:峰值與多少接近,為什么?證明:根據F分布的定義設且X與Y相互獨立,則隨機變量性質1:因此3F分布的性質設隨機變量F~F(m,n),則1/F~F(n,m).因為

T~t(n)

因此存在X~N(0,1),Y~χ2(n),且X與Y相互獨立,使得

性質2:證明:由于X2~χ2(1),且X2與Y相互獨立,使得

特別地性質3:設

X~F(m,n),則對r>0,有

練習:隨機變量X和Y都服從標準正態分布,則(1)X+Y服從正態分布(2)X2+Y2服從

2分布(3)X2和Y2都服從

2分布(4)X2/Y2服從F分布

三大分布的定義(構造性)及其性質1

χ2分布,t分布,F分布奠定了后續正態分布統計推斷的基礎2三大分布小結2.2.4分位數定義2.2.4(分位數)設隨機變量X的分布函數為F(x),對于實數

,0<

<1,若x

滿足P{X>x

}=

,則稱x

為X的概率分布的上

分位數(或分位點),簡稱

分位數.若X的密度函數為f(x),則xα滿足

x

上分位數x

的單調遞減函數.一標準正態分布

設隨機變量X~N(0,1),給定實數

(0<

<1),若u

滿足P{X>u

}=

,則稱

u

為標準正態分布N(0,1)的上

分位數(分位點).Φ(u

)=P{X≤u

}=1?P{X>u

}=1?

u

1?

性質1:Φ(u

)=1?

證明:性質2:u1?

=

?u

得?X~N(0,1)

P{X>?u

}=P{?X<u

}=1?P{?X≥u

}

=1?

P{X>u1?

}=1?

因此

u1?

=

?u

u

u1?

常用數字u0.05=

1.645u0.025=1.96證明:由

X~N(0,1)

-u

例2.2.3設隨機變量X~N(0,1),求常數c,使其滿足P{|X|>c}=.解:由X~N(0,1)

c

=u

/2得

α=

P{|X|>c}=

P{X>c}+P{X<?c}=2P{X>c}因此P{X>c}=

/2即P{|X|>u

/2}=

P{|X|≤u

/2}=

1-

u

/2/2-u

/2/2區間估計假設檢驗二t分布設隨機變量X~t(n),給定實數

(0<

<1)

,若t

(n)滿足P{X>t

(n)}=

,則稱t

(n)為自由度為n的t分布的上

分位數(分位點).性質2:當n較大(n>45)時,t

(n)≈u

性質1:t1?

(n)=?t

(n)t

(n)

t1?

(n)

例2.2.4求

t0.025(200).解:根據u0.025=1.96

t

(n)≈u

得到

t0.025(200)≈u0.025=1.96

.t

/2

(n)

/2

/2-t

/2

(n)f(x)例2.2.5設隨機變量X~t(n),求常數c,使其滿足P{|X|>c}=.解:由X~t(n)

α=

P{|X|>c}=

P{X>c}+P{X<?c}=2P{X>c}因此P{X>c}=

/2即P{|X|>t

/2(n)}=

P{|X|≤t

/2(n)}=

1-

區間估計假設檢驗三

2分布:設隨機變量X~

χ2(n)

,給定實數

(0<

<1),若χ2α(n)滿足P{X>χ2α(n)}=

,則稱χ2α(n)為自由度為n的

2分布的上

分位數(分位點).f(x)αα例2.2.6設隨機變量X~

χ2(n),則f(x)α/2α/2區間估計假設檢驗四F分布

設隨機變量X~F(m,n),給定實數0<

<1,

若Fα(m,n)滿足

則稱

Fα(m,n)

為自由度為m,n的F分布的上

分位數(分位點).f(x)αα設隨機變量X~

F

(m,n),則f(x)α/2α/2區間估計假設檢驗證明性質:因此設隨機變量X~F(m,n),則解:例2.2.7查表得到查表計算根據公式得到N(0,1),t分布,χ2分布,F分布小結1分位數區間估計和假設檢驗2應用對于固定的α(0<α<1),書后附表分別給出了相應的分位數.作業:習題2.2:2,6,8,1,3,7,102.3抽樣

分布定理定理2.3.1:設隨機變量X1,X2,…,Xn

相互獨立,且

令c1,c2,…,cn為常數且不全為0,記2.3.1精確抽樣分布其中則證明:利用特征函數證明.一

相互獨立正態隨機變量線性函數的分布證明:因為其特征函數為因此T的特征函數為T的特征函數為其中由特征函數和分布函數相互唯一確定,得在定理2.3.1中,若在推論2.3.1中,若推論2.3.1:則推論2.3.2:則對于獨立同分布的正態隨機變量的線性變換,有如下結論為nxn的常數方陣,記Y=AX,即則有定理2.3.2:設隨機變量X1,X2,…,Xn獨立同分布,且1.Y1,Y2,···,Yn是正態隨機變量,且2.

當為n階正交陣時,Y1,···,Yn也相互獨立,且其中3.

若μ=0,則Y1,Y2,···,Yn獨立同分布,且證明:1.因為,根據推論2.3.1有因此2.當為n階正交陣時,根據正交陣A的不同行和列的正交性得到當i≠j時因此于是Y1,···,Yn相互獨立,且其中3.若μ=0,則因此,Y1,Y2,···,Yn獨立同分布,且引理2.3.1:設X1,X2,…,Xn是來自總體X(不管是什么分布)的一個樣本,且EX=μ,DX=σ2,則其中為樣本均值為樣本方差二幾個重要定理證明:定理2.3.3:設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,且分別表示樣本均值和樣本方差.則有即和相互獨立.(1)由推論2.3.2得:為一正交陣作正交變換Y=AX,其中Y和X如定理2.3.2所示.(2)設證明:由正交變換保持向量長度不變可知因此所以由定理2.3.2知由A的行向量正交性得Y1,Y2,···,Yn相互獨立,且于是因此,Y2,···,Yn獨立同分布,且(3)由(2)的證明可知只和Y2,···,Yn有關只和Y1有關因此和相互獨立.Y1,Y2,···,Yn相互獨立則定理2.3.4:設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,證明:則Y1,Y2···,Yn獨立同分布,且Y1~N(0,1).因此由于

X1,X2,…,Xn獨立同分布,且X1~N(μ,σ2),令定理2.3.5:設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,分別為樣本均值和樣本方差.則有證明:根據定理2.3.3且和相互獨立.由t

分布的定義,得到定理2.3.6(兩正態總體樣本均值差的分布)設Y1,Y2,…,Yn是來自總體Y的樣本,設X1,X2,…,Xm是來自總體X的樣本,設總體X~N(μ1,σ2),Y~N(μ2,σ2),且X與Y相互獨立,分別為樣本均值.分別為樣本方差.則有其中證明:且可得由U,V獨立,及t分布的定義,得獨立獨立獨立定理2.3.7(兩正態總體樣本方差比的分布)設Y1,Y2,…,Yn是來自總體Y的樣本,設X1,X2,…,Xm是來自總體X的樣本,設總體X~N(μ1,σ12),Y~N(μ2,σ22),且X與Y相互獨立,分別為樣本均值.分別為樣本方差.則有證明:由于由于與相互獨立,根據F分布的定義,得證明由于2λX1的密度函數為恰好是自由度為2的χ2分布,即其中λ>0定理2.3.8(指數分布總體樣本均值的分布)設X1,X2,…,Xn是來自指數分布總體X的樣本,且X的密度函數為證明:由獨立同分布,得到根據χ2分布的可加性,得到獨立同分布,且都服從χ2(2)分布.例2.3.1設X1,X2

,…,Xn是來自正態總體N(μ,σ2)的樣本,

又設Xn+1~N(μ,σ2),且Xn+1與X1,X2

,…,Xn相互獨立,分別為樣本均值和樣本方差,

則有證明:由定理2.3.3(1)(2),得且它們相互獨立.由于Xn+1與X1,X2

,…,Xn相互獨立.所以與Xn+1相互獨立,且因此由

t分布的定義,得從而又與相互獨立根據相互獨立正態隨機變量的線性組合服從正態分布,得例2.3.2設總體X~N(1,σ2),總體Y~N(2,σ2),且X與Y相互獨立,X1,X2,…,Xm

是來自總體X的樣本,Y1,Y2,…,Yn是來自總體Y的樣本,

是兩個固定的實數,求T的分布.分別為樣本均值.分別為樣本方差.解:根據定理2.3.3(1),有根據相互獨立正態隨機變量線性組合仍服從正態分布,得又根據定理2.3.3(2),有根據兩樣本的獨立性和定理2.3.3(3),得U與V相互獨立.根據兩樣本的獨立性和卡方分布的可加性得因此,根據

t分布的定義得到當樣本容量n趨于無窮時,統計量的分布趨于一確定分布,則后者的分布稱為統計量的極限分布,也稱為大樣本分布.當樣本容量n充分大時,極限分布可作為統計量的近似分布.當樣本容量n趨于無窮時,一個統計量或統計推斷方法的性質稱為大樣本性質;定義2.3.1定義2.3.2當樣本容量n固定時,統計量或者統計推斷方法的性質稱為小樣本性質.2.3.2極限分布1.當統計量的精確分布很難求,建立統計量的極限分布提供了一種近似獲得抽樣分布的方法.2.有時統計量的精確分布雖然可求出,但是表達式過于復雜,使用不方便.若極限分布較簡單,可使用極限分布.3.有些統計推斷方法的優良性本身就是研究其極限性質,如相合性、漸近正態性.研究統計量的極限分布有如下意義:設為樣本均值.解:(1)根據大數定律,得刻畫了樣本均值的相合性(大樣本性質).例2.3.3設X1,X2

,…,Xn是來自總體X的樣本,且X~F,其中總體均值μF和方差σF2都存在.討論樣本均值的大樣本性質和小樣本性質.(2)根據中心極限定理,得刻畫了樣本均值的漸近正態性(大樣本性質).(3)由于刻畫了樣本均值的無偏性(小樣本性質).大樣本性質只有在n趨于無窮時才有意義.這條性質的意義是在樣本容量n固定時去理解.例2.3.4若X~χ2(n),則證明:由χ2分布的定義,X可以寫成如下形式其中,Ui~N(0,1),i=1,2,…,n1,且相互獨立由EX=n,DX=2n,根據中心極限定理得到令{Xn,n≥1}

和{Yn,n≥1}是兩個隨機變量序列,滿足當n→∞時為常數定理2.3.9(Slutsky引理)則有例2.3.5設X1,X2,…,Xn是來自兩點分布總體B(1,p),0<p<1的樣本,證明證明:令則由中心極限定理得到由大數定律得到且因此,根據Slutsky引理可知由于作業:習題2.3:2,4,6,8,1219,20,212.4指數族統計理論問題中,許多統計推斷方法的優良性,對一類范圍廣泛的統計模型(也稱為分布族)有比較滿意的結果,這類分布族稱為指數型分布族.常見的分布,如二項分布、Poisson分布、幾何分布、指數分布、正態分布和伽瑪(Gamma)分布都可以統一在指數型分布族中.2.4.1指數族的定義與例子定義2.4.1設是定義在樣本空間χ

上的分布族,其中Θ為參數空間.若f(x,

θ)可以表示為如下形式則稱此分布族為指數型分布族(簡稱指數族).其中f(x,

)在離散情形表示分布列,連續情形表示密度函數,k為自然數,C(

)>0和Qi(

)(i=1,2,…,k)都是定義在參數空間

Θ上的函數.

h(x)>0,

和Ti(x)(i=1,2,…,k)都是定義在樣本空間χ上的函數.一指數族的定義的表示不唯一.1支撐集與

無關,即23或說明例2.4.1二項分布族{B(n,

):0<

<1}是指數族.樣本空間為χ={0,1,2,…,n}.參數空間為Θ={

:0<

<1}.

設X~B(n,

),其分布列為證明:二指數族的例子其中滿足指數族的定義,因此二項分布族是指數族.證明:例2.4.2泊松分布族{P(

):

>0}是指數族.設X~P(

),其分布列為樣本空間為χ={0,1,2,…,}.參數空間為Θ={

:>0}.

其中滿足指數族的定義,因此泊松分布族是指數族.樣本X1,X2,…,Xn的聯合密度函數為記=(μ,σ2),則參數空間為證明:例2.4.3設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,則樣本分布族是指數族.其中滿足指數族的定義,因此上述樣本分布族是指數族.特別地,取樣本容量n=1,X1的密度函數為滿足指數族的定義,因此正態分布族是指數族.其中X1的密度函數為證明:例2.4.4設X1,X2,…,Xn是從伽瑪分布Ga(α,

),α>0,

>0中抽取的樣本,則樣本分布族是指數族.則樣本X1,X2,…,Xn的聯合密度函數為記

=(α,

),則參數空間為其中滿足指數族的定義,因此上述樣本分布族是指數族.與未知參數

有關,因此均勻分布族族{U(0,

):

>0}不是指數族.均勻分布族的支撐集為證明:例2.4.5均勻分布族{U(0,

):

>0}不是指數族.其中-∞<

<

∞和μ

>0是為未知參數,它的支撐集為證明:雙參數指數分布的密度函數為與未知參數μ有關,若μ已知,如μ=0,因此雙參數指數分布不是指數族.例2.4.6雙參數分布族{Exp(

,μ):

>0,-∞<μ<∞}不是指數族.則單參數指數分布族{Exp(

):

>0}是指數族.2.6.2指數族的自然形式及自然參數空間則稱它為指數族的自然形式(標準形式).此時集合稱為自然參數空間.定義2.4.2:如果指數族有下列形式一指數族自然形式的定義例2.4.7把二項分布族表示成指數族的自然形式(標準形式),

并求出自然參數空間.解:二項分布的指數族形式為令參數空間為可知解出二指數族自然形式的例子其中因此二項分布族的自然形式(標準形式)為自然參數空間為解:例2.4.8把泊松布族表示成指數族的自然形式,并求出自然參數空間.泊松分布的指數族形式參數空間為Θ={

:>0}.

令可知解出其中因此泊松分布族的自然形式(標準形式)為自然參數空間為正態分布的指數族形式為記=(μ,σ2),則參數空間為解:例2.4.9設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,將樣本分布族表示為指數族的自然形式(標準形式),并求出自然參數空間.令解出其中因此樣本分布族的自然形式(標準形式)為自然參數空間為在指數族的自然形式下,自然參數空間為凸集.證明:指數族的自然形式為自然參數空間為定理2.4.1:設任取則即此處用了Holder不等式.則因此,在指數族的自然形式下,自然參數空間為凸集.作業:習題2.4:3,4,5,6,72.5充分統計量統計量是對樣本的簡化,希望:簡化程度高,同時信息損失少.一個統計量能集中樣本中信息的多少,與統計量的具體形式有關,也依賴于問題的統計模型,我們希望所用的統計量能把樣本中關于未知參數的信息全部“提煉”起來,即說不損失(重要)信息的統計量——充分統計量.問題:如何定義一個統計量是充分統計量?引例:設X=(X1,X2,…,Xn)是從0-1分布中抽取的簡單隨機樣本,且P{Xi=1}=

,P{Xi=0}=1-

,記若只對

作推斷,

T(X)與樣本含的信息一樣,即T(X)應該是充分統計量.則T(X)與樣本(X1,X2,…,Xn)相差的僅僅是,

X1,X2,…,Xn中1的具體位置.樣本(X1,X2,…,Xn)加工成統計量T(X1,X2,…,Xn)后,一般來說在信息上會有所損失,但是如果加工抓住了問題的實質,回到引例直觀上:如果一個統計量滿足這個要求,就稱其為充分統計量.即:統計量T(X1,X2,…,Xn)保留了樣本(X1,X2,…,Xn)中所含參數

的全部信息,丟掉的就是一些無關緊要的東西.樣本X1,X2,…,Xn的分布,記

如何定義充分統計量?統計量T(X)的分布關于樣本X=(X1,X2,…,Xn)的信息可以設想成如下公式{樣本X中的信息}={T(X)中所含樣本的信息}+{除了T(X)中的信息外,樣本X含有的信息}因此T(X)為充分統計量的要求歸結為要求后一項信息為0用統計語言描述為,即要求與

無關,其中A為任一事件.2.5.1充分統計量的定義和例子定義2.5.1設樣本X1,X2,…,Xn的分布族為設T=T(X1,X2,…,Xn)為一統計量,若在給定T的條件下,樣本X1,X2,…,Xn的條件分布與參數

無關,則稱統計量T(X1,X2,…,Xn)為參數

的充分統計量.說明:1.充分統計量必存在.2.條件分布的作用是抽取信息.實際應用時,條件分布用條件概率(離散情形)和條件密度函數(連續情形)代替.樣本本身是充分統計量,順序統計量是充分統計量.3.充分統計量可以是向量,即不一定與參數的維數相同.(例2.5.9)為充分統計量.記T=T(X1,X2,…,Xn),按照定義只要證明下列條件概率與參數

無關.證明:例2.5.1

設X1,X2,…,Xn是來自兩點分布總體B(1,

)的樣本,證明兩點分布的分布列為當T=t

時,有因此,有上述條件概率與參數

無關.因此是充分統計量.為充分統計量.記T=T(X1,X2,…,Xn),按照定義只要證明下列條件概率與參數

無關.證明:例2.5.2

設X1,X2,…,Xn是來自幾何分布總體G(

)的樣本,證明幾何分布的分布列為由幾何分布的性質知,T的分布列為當T=t

時,有因此,有上述條件概率與參數

無關.因此是充分統計量.因此,T(X1,X2,…,Xn)=X1不是充分統計量.證明:與μ有關.例2.5.3設X1,X2,…,Xn是來自正態總體N(μ,1)的樣本,則不是充分統計量.記T=T(X1,X2,…,Xn),在T=x1條件下,X1,X2,…,Xn的條件密度函數為證明:例2.5.4設X1,X2,…,Xn是來自正態總體N(μ,1)的樣本,證明為充分統計量.記T=T(X1,X2,…,Xn),由正態分布的性質知,在給定在T=t

條件下,X1,X2,…,Xn的條件密度函數為上述條件密度函數與參數與μ

有關,因此為充分統計量.例2.5.4中,僅有一個未知參數

μ

,如果其方差也是未知的,則利用定義來求充分統計量比較困難;從上面的例子也可以看出,求充分統計量,必須先猜測一個統計量,之后再用定義證明,這很不便于利用,于是有如下的因子分解定理.2.5.2因子分解定理因子分解定理是由R.A.Fisher在20世紀20年代提出,它的一般形式和嚴格數學證明是由Halmos和Savage在1949年給出.T=T(X1,X2,…,Xn)是充分統計量的充要條件是f(x1,x2,…,xn,

),可以分解為定理2.5.1(因子分解定理)設樣本X1,X2,…,Xn的聯合密度函數(或聯合分布列)為f(x1,x2,…,xn,

),T=T(X1,X2,…,Xn)是一個統計量,則其中

h(x1,x2,…,xn)不依賴于參數

.充分統計量的一一變換不改變統計量的充分性.證明:存在逆函數T=k(S),因為

S

(T)是單值可逆函數,根據因子分解定理取則根據因子分解定理,S

(T)是

的充分統計量.推論2.5.1設T=T(X1,X2,…,Xn)為

的充分統計量,S(T)是單值可逆函數,則S(T)也是

的充分統計量.證明:例2.5.5設X1,X2,…,Xn是來自正態總體N(μ,1)的樣本,證明為充分統計量.由例2.5.4是參數μ的充分統計量,因為

與一一對應.因此是μ的充分統計量.但是不是μ的充分統計量.樣本X1,X2,…,Xn的聯合分布列為根據因子分解定理,知為充分統計量.證明:其中h(x1,x2,…,xn)=1.為充分統計量.例2.5.6

設X1,X2,…,Xn是來自兩點分布總體B(1,

)的樣本,則樣本X1,X2,…,Xn

的聯合密度函數為為充分統計量.

證明:其中h(x1,x2,…,xn)=1.例2.5.7設X1,X2,…,Xn是來自正態總體N(μ,σ2)的樣本,令

=(μ,σ2),則根據因子分解定理,知為充分統計量.由于與為一一對應的變換.根據推論2.5.1可知也為充分統計量.為充分統計量.根據因子分解定理,知為充分統計量.其中例2.5.8設X1,X2,…,Xn是來自均勻分布總體U[0,

]的樣本,則樣本X1,X2,…,Xn

的聯合密度函數為證明:為充分統計量.例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論