統計學總體分布參數估計_第1頁
統計學總體分布參數估計_第2頁
統計學總體分布參數估計_第3頁
統計學總體分布參數估計_第4頁
統計學總體分布參數估計_第5頁
已閱讀5頁,還剩61頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統計學總體分布參數估計第1頁,課件共66頁,創作于2023年2月

§4.1總體分布與樣本分布一、總體(母體):反映總體特征的隨機變量的取值的全體。總體分布(母體分布):反映總體特征的隨機變量的概率分布。從無限次隨機抽取(然后放回)的角度看,表征一個總體特征的變量(指標),都可以視為隨機變量。有限總體的概率分布,就是有限總體中不同個體的比率(頻率)分布。二、隨機樣本與樣本觀測值(樣本數據)1、隨機樣本表征n次抽取個體的隨機抽樣的一組隨機變量X1,X2,···,Xn。第2頁,課件共66頁,創作于2023年2月2、樣本觀測值n次隨機抽樣的結果:x1,x2,···,xn

(稱為隨機樣本X1,X2,···,Xn的樣本觀測值)。n稱為隨機樣本向量(X1,X2,···,Xn

)的維度,即自由度。3、樣本(累積)分布函數設樣本觀測值x1x2,···,

xn

ki為小于xi+1的樣本值出現的累積頻次,n為樣本容量,則可得樣本累積頻率分布函數如下:樣本累積頻率分布函數,又稱樣本(累積)分布函數.樣本(累積)分布函數Fn(x)是對總體的累積分布函數F(x)的近似,n越大,Fn(x)對F(x)的近似越好.第3頁,課件共66頁,創作于2023年2月樣本分布與總體分布格利文科(Glivenko)定理(樣本分布與總體分布的關系)定理:當樣本容量n趨于無窮大時,Fn(x)以概率1(關于x)均勻地收斂于F(x).該定理是運用樣本推斷總體的理論依據.定理的數學表達為:第4頁,課件共66頁,創作于2023年2月

隨機樣本的均值函數和方差函數都是一個隨機變量.樣本數據的樣本均值x是隨機變量X的觀測值;樣本數據的樣本方差s2

是隨機變量S2

的觀測值.隨機樣本的均值函數:隨機樣本的方差函數:三、統計量與統計量的分布統計量定義:統計量是不含未知參數的,隨機樣本X1,X2,···,

Xn的函數。第5頁,課件共66頁,創作于2023年2月統計量的值的定義:統計量的值是不含未知參數的,樣本觀測值x1,x2,···,xn的函數.四、由標準正態分布N(0,1)的隨機樣本所引出的幾個重要統計量分布:2、t與F分布1、2(n)分布的構成設隨機變量X服從N(0,1)分布,X1,X2,···,

Xn為X樣本,則

2=

X2i=X21+X22+···

X2n

服從自由度為n的2分布,記為2~2(n)。2(n)分布的均值E(2)=n,方差D(2)=2n。第6頁,課件共66頁,創作于2023年2月n=1n=4n=102(n)分布圖2(n)密度函數:其中,n為自由度。(n/2)為珈瑪函數,是一個含參數n/2的積分,為:第7頁,課件共66頁,創作于2023年2月2、t分布自由度為n的t分布,記為t(n),是由N(0,1)分布和2(n)分布組成的,其表達式為:其中,X服從N(0,1),Y服從2(n)分布,且X與Y相互獨立。密度函數為:第8頁,課件共66頁,創作于2023年2月t分布圖3、F分布F分布是由兩個2分布之比組成的:服從F(m,n)。其中,U服從2(m),V服從2(n)。第9頁,課件共66頁,創作于2023年2月m=100,n=20m=15,n=20重要性質:密度函數形式為:第10頁,課件共66頁,創作于2023年2月五、由一般正態分布的隨機樣本所構成的若干重要統計量的分布定理:若X1,X2,···,

Xn是正態總體N(,2)的一個隨機樣本,則樣本均值函數和樣本方差函數,滿足如下性質:(1)X服從N(,2/n)分布。(2)X與S2相互獨立。(3)

服從N(0,1)分布;(4)服從2(n-1)分布;第11頁,課件共66頁,創作于2023年2月(5)服從t(n-1)分布;(1)服從N(0,1)。(6)服從2(n)分布;定理:若X1,X2,···,

Xn1和Y1,Y2,···,Yn2分別是正態總體N(1,12)和N(2,22)的一個隨機樣本,且它們相互獨立,則滿足如下性質:第12頁,課件共66頁,創作于2023年2月(3)服從F(n1-1,n2-1)。其中,S12是容量為n1的X的樣本方差,S22是容量為n2的Y的樣本方差。(2)服從t(n1+n2-2),(1=2)。(4)服從F(n1,n2)。第13頁,課件共66頁,創作于2023年2月六、任意分布的隨機樣本均值函數的均值與方差設:隨機變量X服從任何均值為,標準差為的分布,X是隨機樣本X1,X2,···,

Xn的均值函數。記隨機變量X的分布函數的均值為X,標準差為X,則有如下結論成立:X=;(2)X=/n或2X=2/n注:一個應用廣泛的樣本均值函數的均值和方差:0-1分布的樣本均值函數均值和方差。反映總體中某類個體的比例的隨機變量X,可以簡單地用0-1分布B(1,p)表示.E(X)=p,D(X)=p(1-p).p是總體中某類個體的比例.由樣本X1,X2,···,

Xn產生均值函數X的均值X

=p,第14頁,課件共66頁,創作于2023年2月方差的均值也是總體中某類個體的比例p.所以,常用x來估計p.七、大樣本均值函數的分布:中心極限定理設:隨機變量X服從任何均值為,標準差為的分布,X是隨機樣本X1,X2,···,

Xn的均值函數。中心極限定理:當n充分大時,X近似地服從均值為,標準差為/n的正態分布。在實際問題中n多大?但一般n30。第15頁,課件共66頁,創作于2023年2月

對于一個學生而言,來參加家長會的家長人數是一個隨機變量.設一個學生無家長、1名家長、2名家長來參加會議的概率分別為0.05、0.8、0.15.若學校共有400名學生,設各學生參加會議的家長數相互獨立,且服從同一分布.(1)求參加會議的家長數X超過450的概率;(2)求有1名家長來參加會議的學生數不多于340的概率.解中心極限定理例題解析第16頁,課件共66頁,創作于2023年2月根據中心極限定理第17頁,課件共66頁,創作于2023年2月中心極限定理可得:第18頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量§4.2點估計在實際問題中,人們常常判斷總體分布的參數,這就需要用樣本來推斷總體分布的這些參數,這就是參數估計。參數估計分為:點估計和區間估計兩種方法。1、點估計概念設是總體分布中一個需要估計的參數,現從總體中抽取一個隨機樣本X1,X2,···,

Xn,記估計的統計量為

則稱為的估計量。第19頁,課件共66頁,創作于2023年2月若得到一組樣本觀測值x1,x2,···,xn,就可得出的估計值,記:。注:在選取樣本統計量作為點估計時,必須考慮到“無偏差性”,這一點很重要。如果樣本統計量的期望值(或均值)與打算估計的總體參數值相同,則估計值不存在偏差。總體分布參數的點估計,就是求出的估計值。第20頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量

點估計

–第21頁,課件共66頁,創作于2023年2月2、矩法估計就是用樣本矩來估計總體矩。矩的一般形式:

E(Xk)表示k階原點矩(以原點為中心);

E(X-)k表示k階中心矩(以為中心);3、極大似然估計法設:總體X的(累積)概率分布函數為F(x,),概率密度函數f(x,),其中為未知參數(也可以表示未知參數向量).若X為離散型隨機變量,則由離散型與連續型的對應關系,f(x,)對應于離散情況下的概率P(X=x).第22頁,課件共66頁,創作于2023年2月X為連續型隨機變量時,X的隨機樣本X1,X2,···,

Xn的聯合概率密度函數為

稱為的極大似然估計函數.當X為離散隨機變量時,L表示概率:L關于的極大值如果存在,極大值就是的極大似然估計值.其含義是:一組觀測值x1,x2,···,xn在一次實驗中出現了,其聯合概率就應當是最大的,所以選擇使聯合密度L最大的那個

.第23頁,課件共66頁,創作于2023年2月例:設x1,x2,···,xn是正態總體N(,2)的一個樣本觀測值,求與2的極大似然估計值.解:極大似然函數為取對數,分別對與2求偏導,并令偏導為0,可求出與2的極大似然估計值如下:如果將上述xi換成Xi,上式成為極大似然估計量.第24頁,課件共66頁,創作于2023年2月例:設X服從區間[a,b]上的均勻分布,a、b是求知參數,(x1,x2,···,xn)是來自總體X的樣本,求a、b的矩估計量解:X的密度函數第25頁,課件共66頁,創作于2023年2月第26頁,課件共66頁,創作于2023年2月§4.3判別點估計的優劣標準1、無偏估計量如果,則稱為的無偏估計量。2、最小方差性若總體參數為,的估計量的方差Var()小于等于其他所有對的估計量的方差,即則稱的估計量具有最小方差性。3、有效估計量如果一個估計量滿足(1)無偏性;(2)最小方差性。第27頁,課件共66頁,創作于2023年2月那么,該估計量為有效估計量。4、漸近無偏估計量如果:,(n為樣本容量)則稱為漸近無偏估計量。5、一致估計量如果滿足:則稱為的一致估計量。一致估計量的另一等價定義:(1)漸進無偏的;(2)第28頁,課件共66頁,創作于2023年2月9、漸進有效性如果一個估計量滿足:(1)是一致估計量;(2)比其它的估計量更小的漸進方差。注:在實踐中廣泛應用的準則:(1)小樣本準則a、無偏性;b、有效性。(2)大樣本準則一致估計量。漸進方差定義:第29頁,課件共66頁,創作于2023年2月例:設(x1,x2,···,xn)是來自具有有限數學期望的任一總體X的一個樣本,記E(X)=a,證明:是a的無偏估計。第30頁,課件共66頁,創作于2023年2月第31頁,課件共66頁,創作于2023年2月§4.4區間估計1、置信區間若總體分布含有一個未知參數,找出了2個依賴于樣本X1,X2,···,

Xn的估計量:使其中,01,一般取0.05或0.01,則稱隨機區間為的100(1-)%的置信區間.百分數100(1-)%稱為置信度.2、總體均值的置信區間(總體方差已知)設:總體X服從已知N(,2),2已知,抽取n個觀第32頁,課件共66頁,創作于2023年2月測值x1,x2,···,xn,求總體均值的100(1-)%(如=95%)的置信區間。首先構造:因為X服從N(,2/n)分布,所以Z服從N(0,1)分布。由:得置信區間:第33頁,課件共66頁,創作于2023年2月Z/2Z1-/21-/2/2例:設:總體X服從已知N(,0.09),抽取4個觀測值x1,x2,x3,x4,求總體均值的95%的置信區間。解:由已知:1-=0.95,=0.3,n=4根據:第34頁,課件共66頁,創作于2023年2月得到:查表得z0.025=1.96,于是置信區間為(X-0.294,X+0.294),置信度為95%.也就是說:總體均值以95%的概率在該區間內.第35頁,課件共66頁,創作于2023年2月3、總體均值的置信區間(總體方差未知)設:總體X服從已知N(,2),2未知,抽取n個觀測值x1,x2,···,xn,求總體均值的100(1-)%=95%的置信區間。首先構造:可得置信區間:第36頁,課件共66頁,創作于2023年2月由:將n個觀測值x1,x2,···,xn代入上式得到置信區間。4、總體方差的置信區間(未知總體均值)設:總體X服從已知N(,2),未知,抽取n個觀測值x1,x2,···,xn,求總體方差2的100(1-)%=95%的置信區間。首先構造:第37頁,課件共66頁,創作于2023年2月得到置信區間:由:將n個觀測值x1,x2,···,xn代入上式得到置信區間。5、總體比例的置信區間Letpdenotetheobservedproportionof“successes”inarandomsampleofnobservationsfromapopulationwithaproportionofsuccesses.Then,ifnislargeenoughthat(n)()(1-)>9,thena100(1-)%confidenceintervalforthepopulationproportionisgivenby第38頁,課件共66頁,創作于2023年2月orequivalently,wherethemarginoferror,thesamplingerror,orbound,B,isgivenbyandZ/2,isthenumberforwhichastandardnormalvariableZsatisfies第39頁,課件共66頁,創作于2023年2月總體方差的區間估計

(例題分析)【例】一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表7所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第40頁,課件共66頁,創作于2023年2月總體方差的區間估計

(例題分析)解:已知n=25,1-=95%,根據樣本數據計算得s2=93.21

2置信度為95%的置信區間為該企業生產的食品總體重量標準差的的置信區間為7.54克~13.43克第41頁,課件共66頁,創作于2023年2月總體均值的區間估計

(例題分析)【例】已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區間16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470第42頁,課件共66頁,創作于2023年2月總體均值的區間估計

(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為該種燈泡平均使用壽命的置信區間為1476.8小時~1503.2小時第43頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量區間估計–總體參數值很可能落在區間估計所包括的數值范圍內;使我們知道被估計值可能產生多大的誤差邊際;給出估計的信賴程度(或置信度)。第44頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量定義與區間估計相聯系的信賴程度,常常用(1–)100%來表示。置信水平

置信區間

指某一指定置信水平下的區間估計,該區間包括了總體參數的真值。置信水平高

置信區間就寬

第45頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量置信區間就寬

樣本統計量(點估計)置信界限(下限)置信界限(上限)第46頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量x

/2區間的較大數值在100(1-)%水平下,區間包含;在100%水平下,區間不包含;=

1-/2x_x__第47頁,課件共66頁,創作于2023年2月對比總體參數和樣本統計量解釋95%的置信區間表達了什么含義95%的置信水平意味著:如果從總體中隨機抽取容量為n的所有可能樣本,并相應計算這些樣本的置信區間,則在計算之后有95%的區間將包括總體參數的真值。第48頁,課件共66頁,創作于2023年2月總體均值的置信區間--已知(1)無論樣本容量為多少,原有總體服從正態分布;或者(2)原有總體不服從正態分布,但樣本容量n

30。

服從均值=、標準差為的正態分布而且第49頁,課件共66頁,創作于2023年2月總體均值的置信區間--已知(1–)100%水平下的置信區間即,因此,第50頁,課件共66頁,創作于2023年2月總體均值的置信區間--已知舉例:根據以前獲得的經驗,我們知道某臺機器在生產訓練用的鋼管時,其直徑的標準差為0.135厘米。如果從中抽取30根管子作為一個簡單隨機樣本,則這些管子的平均直徑為3.6厘米。請問在95%的置信水平下,這些管子的平均直徑的置信區間是多少?

n=30,=0.135cm,=3.6cm根據中心極限定理,近似服從正態分布第51頁,課件共66頁,創作于2023年2月總體均值的置信區間--已知在95%水平下的置信區間是而且=3.61.960.02465=(3.55,3.65)在95%的置信水平下,由這臺機器生產的訓練用管子,其平均直徑應當在3.55厘米至3.65厘米范圍之內。第52頁,課件共66頁,創作于2023年2月如果總體的未知,則的抽樣分布服從自由度為n–1的t分布,即如果樣本容量足夠大,我們可以用正態分布而不是t分布。總體均值的置信區間–未知第53頁,課件共66頁,創作于2023年2月總體均值的置信區間–未知如果是大樣本(n

30),則在(1–)100%水平下,的置信區間是如果是小樣本(n<30)并且原有總體近似服從正態分布,則在(1–)100%水平下,的置信區間是第54頁,課件共66頁,創作于2023年2月總體均值的置信區間–未知一家郵購公司在圣誕節前的一周內會接聽大量的訂購電話。過去經驗表明,由于工作人員每天可能要接聽幾千個電話,因此為了及時處理打入的電話數量,有必要增加銷售人員人數。為此,這家公司記錄了75%的員工在每8小時之內接聽電話的數量,結果發現他們平均要接聽89.6個電話,而且標準差為17.32。請問在90%的置信水平下,被接聽電話的平均數量的置信區間是多少?

舉例:第55頁,課件共66頁,創作于2023年2月總體均值的置信區間–未知s=17.32, n=75(大樣本)的抽樣分布近似服從以下參數的正態分布在90%水平下,的置信區間而且=89.61.6452=(86.31,92.89)第56頁,課件共66頁,創作于2023年2月總體均值的置信區間–未知舉例:一家會計公司想要設立一項時間標準,以便其工作人員能及時完成某類審計工作。它抽取了18名初級審計員作為一個樣本并記錄了他們的審計時間,結果發現這些人員的平均審計時間為3.2個小時,標準差為1.6個小時。請問在95%的置信水平下,當完成某類審計工作時其平均審計時間的置信區間是多少?第57頁,課件共66頁,創作于2023年2月總體均值的置信區間–未知s=1.6, n=18(小樣本)的抽樣分布服從自由度為17的t分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論