概率論與數理統計第六章統計量,樣本及抽樣分布_第1頁
概率論與數理統計第六章統計量,樣本及抽樣分布_第2頁
概率論與數理統計第六章統計量,樣本及抽樣分布_第3頁
概率論與數理統計第六章統計量,樣本及抽樣分布_第4頁
概率論與數理統計第六章統計量,樣本及抽樣分布_第5頁
已閱讀5頁,還剩32頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 數理統計學是一門應用性很強的學科數理統計學是一門應用性很強的學科. 它是研究它是研究怎樣以怎樣以有效的方式收集有效的方式收集、 整理和分析帶有整理和分析帶有隨機性的隨機性的數據數據,以便對所考察的問題作出,以便對所考察的問題作出推斷和預測推斷和預測. 由于大量隨機現象必然呈現它由于大量隨機現象必然呈現它規規律性律性,只要對隨機現象進行,只要對隨機現象進行足夠多次足夠多次觀察,被研究的規律性一定能清楚地觀察,被研究的規律性一定能清楚地呈現出來呈現出來. 客觀上,客觀上, 只允許我們對隨機現象只允許我們對隨機現象進行次數不多的觀察試驗進行次數不多的觀察試驗 ,我們只,我們只能獲得能獲得局部局部觀

2、察資料觀察資料.第一節第一節 隨機樣本隨機樣本 在數理統計中,不是對所研究的對象全體在數理統計中,不是對所研究的對象全體 ( 稱稱為總體為總體)進行觀察,而是抽取其中的部分進行觀察,而是抽取其中的部分(稱為樣本稱為樣本)進行觀察獲得數據(抽樣),并通過這些數據對總進行觀察獲得數據(抽樣),并通過這些數據對總體進行推斷體進行推斷.數理統計方法具有數理統計方法具有“部分推斷整體部分推斷整體”的的特征特征 . 在數理統計研究中,人們往往研究有關對象的在數理統計研究中,人們往往研究有關對象的某一項某一項(或幾項或幾項)數量指標和為此,對這一指標進行數量指標和為此,對這一指標進行隨機試驗,觀察試驗結果全

3、部觀察值,從而考察該隨機試驗,觀察試驗結果全部觀察值,從而考察該數量指標的分布情況數量指標的分布情況.這時,每個具有的數量指標的這時,每個具有的數量指標的全體就是總體全體就是總體.每個數量指標就是個體每個數量指標就是個體.某批某批燈泡的壽命燈泡的壽命該批燈泡壽命的全該批燈泡壽命的全體就是總體體就是總體國產轎車每公里國產轎車每公里的耗油量的耗油量國產轎車每公里耗油量國產轎車每公里耗油量的全體就是總體的全體就是總體 一一個統計問題總有它明確的研究對象個統計問題總有它明確的研究對象.1.1.總體總體研究某批燈泡的質量研究某批燈泡的質量 研究對象的全體稱為研究對象的全體稱為總體總體,總體總體一、總體和

4、樣本一、總體和樣本總體中所包含的個體的個數稱為總體的容量總體中所包含的個體的個數稱為總體的容量.總體中每個成員稱為個體,總體中每個成員稱為個體,總體總體有限總體有限總體無限總體無限總體 因此在理論上可以把總體與概率分布等同起來因此在理論上可以把總體與概率分布等同起來. 我們關心的是總體中的個體的某項指標我們關心的是總體中的個體的某項指標( (如人的如人的身高、燈泡的壽命身高、燈泡的壽命, ,汽車的耗油量汽車的耗油量) ) . 由于每個個體的出現是隨機的,所以相應的數量指由于每個個體的出現是隨機的,所以相應的數量指標的出現也帶有隨機性標的出現也帶有隨機性 . 從而可以把這種數量指標看從而可以把這

5、種數量指標看作一個隨機變量作一個隨機變量x ,因此隨機變量,因此隨機變量x的分布就是該數的分布就是該數量指標在總體中的分布量指標在總體中的分布. 總體就可以用一個隨機變量及其分布來描述總體就可以用一個隨機變量及其分布來描述. 例如例如:研究某批燈泡的壽命時,關心的數量指標研究某批燈泡的壽命時,關心的數量指標就是壽命,那么,此總體就可以用隨機變量就是壽命,那么,此總體就可以用隨機變量x表示,表示,或用其分布函數或用其分布函數f(x)表示表示.x:某批某批燈泡的壽命燈泡的壽命總體總體 壽命壽命 x 可用一概率分布可用一概率分布(如指數分布)來刻劃(如指數分布)來刻劃鑒于此,常用隨機變量的記號鑒于此

6、,常用隨機變量的記號或用其分布函數表示總體或用其分布函數表示總體. 如如說總體說總體x或總體或總體f(x) . 類似地,在研究某地區中學生的營養狀況時類似地,在研究某地區中學生的營養狀況時 ,若關心的數量指標是身高和體重,我們用若關心的數量指標是身高和體重,我們用x 和和y 分分別表示身高和體重,那么此總體就可用二維隨機變別表示身高和體重,那么此總體就可用二維隨機變量量(x,y)或其聯合分布函數或其聯合分布函數 f(x,y)來表示來表示. 統計中,總體這個概念統計中,總體這個概念 的要旨是:的要旨是:總體就是一個概總體就是一個概率分布率分布.參數的分布,為推斷總體分布及各種特征,按一參數的分布

7、,為推斷總體分布及各種特征,按一定規則從總體中抽取若干個體進行觀察試驗,以定規則從總體中抽取若干個體進行觀察試驗,以獲得有關總體的信息獲得有關總體的信息 ,這一抽取過程稱為,這一抽取過程稱為 “抽抽樣樣”,所抽取的部分個體稱為樣本,所抽取的部分個體稱為樣本. 樣本中所包樣本中所包含的個體數目稱為含的個體數目稱為樣本容量樣本容量.2. 樣本樣本從國產轎車中從國產轎車中抽抽5輛輛進行耗油量試驗進行耗油量試驗樣本容量為樣本容量為5抽到哪抽到哪5輛是隨機的輛是隨機的 總體分布一般是未知,或只知道是包含未知總體分布一般是未知,或只知道是包含未知 一旦取定一組樣本一旦取定一組樣本x1, ,xn ,得到得到

8、n個具體的數個具體的數 (x1,x2,xn),稱為樣本的一次觀察值,簡稱樣本值,稱為樣本的一次觀察值,簡稱樣本值 .n稱為這個樣本的容量稱為這個樣本的容量.21nxxxnx,觀察,其結果依次記為觀察,其結果依次記為次重復、獨立次重復、獨立在相同的條件下,進行在相同的條件下,進行對總體對總體.,21分布分布同的同的與總體隨機變量具有相與總體隨機變量具有相的一個簡單隨機樣本,的一個簡單隨機樣本,是來自總體是來自總體這樣得到的隨機變量這樣得到的隨機變量xxxxn最常用的一種抽樣叫作最常用的一種抽樣叫作“簡單隨機抽樣簡單隨機抽樣”,其特點:,其特點:1. 代表性:代表性: x1,x2,xn中每一個與所

9、考察的總體有中每一個與所考察的總體有 相同的分布相同的分布.2. 獨立性:獨立性: x1,x2,xn是相互獨立的隨機變量是相互獨立的隨機變量.定義:定義: 由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,它可以用與總體獨立同分布的它可以用與總體獨立同分布的n個相互獨立的隨機個相互獨立的隨機變量變量x1,x2,xn表示表示.),(21*nxxxf=f(x1) f(x2) f(xn) ),(21*nxxxf=f(x1) f(x2) f(xn) 若總體的分布函數為若總體的分布函數為f(x)、概率密度函數為、概率密度函數為f(x),則其簡單隨機樣本的聯合分布函數為則

10、其簡單隨機樣本的聯合分布函數為其簡單隨機樣本的聯合概率密度函數為其簡單隨機樣本的聯合概率密度函數為的取值的取值是總體隨機樣本是總體隨機樣本這里這里),(),(2121nnxxxxxx 事實上我們抽樣后得到的資料都是具體的、確事實上我們抽樣后得到的資料都是具體的、確定的值定的值. 如我們從某班大學生中抽取如我們從某班大學生中抽取10人測量身高人測量身高,得到得到10個數,它們是樣本取到的值而不是樣本個數,它們是樣本取到的值而不是樣本. 我我們只能觀察到隨機變量取的值而見不到隨機變量們只能觀察到隨機變量取的值而見不到隨機變量.3. 總體、樣本、樣本值的關系總體、樣本、樣本值的關系總體(理論分布)總

11、體(理論分布) ? 樣本樣本 樣本值樣本值 統計是從手中已有的資料統計是從手中已有的資料-樣本值,去推斷總樣本值,去推斷總體的情況體的情況-總體分布總體分布f(x)的性質的性質. 總體分布決定了樣本取值的概率規律,也就是總體分布決定了樣本取值的概率規律,也就是樣本取到樣本值的規律,因而可以由樣本值去推斷樣本取到樣本值的規律,因而可以由樣本值去推斷總體總體. 樣本是聯系二者的橋梁樣本是聯系二者的橋梁總體:研究對象的全體稱為總體總體:研究對象的全體稱為總體個體:總體中每個成員稱為個體個體:總體中每個成員稱為個體:簡單隨機樣本簡單隨機樣本 由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,由簡單隨機抽樣得到

12、的樣本稱為簡單隨機樣本,它可以用與總體它可以用與總體x獨立同分布的獨立同分布的n個相互獨立的隨機個相互獨立的隨機變量變量 x1,x2,xn表示表示, n為樣本容量為樣本容量,其觀察值為其觀察值為.,21nxxx統計模型:統計模型:)(),(21獨立同分布獨立同分布的聯合分布的聯合分布樣本樣本nxxx小結小結第三節第三節 樣本及抽樣分布樣本及抽樣分布統計量統計量統計三大抽樣分布統計三大抽樣分布幾個重要的抽樣分布定理幾個重要的抽樣分布定理 由樣本值去推斷總體情況,需要對樣本值進行由樣本值去推斷總體情況,需要對樣本值進行“加工加工”,這就要構造一些樣本的函數,它把樣本中所含的(某,這就要構造一些樣本

13、的函數,它把樣本中所含的(某一方面)的信息集中起來一方面)的信息集中起來.1. 統計量統計量 這種不含任何未知參數的樣本的函數這種不含任何未知參數的樣本的函數 稱為統稱為統計量計量. 它是完全由樣本決定的量它是完全由樣本決定的量,其取值其取值(觀察值觀察值)是是一、統計量一、統計量),(21nxxxg),(21nxxxg 幾個常見統計量幾個常見統計量樣本平均值樣本平均值niixnx11它反映了總體均值它反映了總體均值的信息的信息樣本方差樣本方差niixxns122)(11它反映了總體它反映了總體方差的信息方差的信息 niixnxn12211樣本標準差樣本標準差 niixxns12)(11常用的

14、統計量常用的統計量 niixnx11觀察值觀察值 niixnxns122211觀察值觀察值 niixxns12)(11觀察值觀察值nikikxna11它反映了總體它反映了總體k 階矩的信息階矩的信息樣本樣本k階原點矩階原點矩樣本樣本k階中心矩階中心矩nikikxxnb1)(1 k=1,2,它反映了總體它反映了總體k 階階中心矩的信息中心矩的信息請注意請注意 :., 2 , 11)(1 kxnanxekxkpnikikkk時,時,存在,則當存在,則當階矩階矩的的若總體若總體.),(),(2121為連續函數為連續函數其中其中可將上述性質推廣為可將上述性質推廣為由依概率收斂性質知,由依概率收斂性質知

15、,再再ggaaagkpk .根據根據這就是矩估計法的理論這就是矩估計法的理論., 2 , 1)(,2121上述結論上述結論再由辛欽大數定律可得再由辛欽大數定律可得同分布同分布獨立且與獨立且與有有同分布,同分布,獨立且與獨立且與由由事實上事實上nkxexxxxxxxxkkikknkkn 二、統計三大抽樣分布二、統計三大抽樣分布定義定義: 設設 相互獨立相互獨立, 都服從正態分布都服從正態分布n(0,1), 則稱隨機變量:則稱隨機變量: nxxx,21222212nxxx2分布是由正態分布派生出來的一種分布分布是由正態分布派生出來的一種分布. .分布分布2. 1 )(22nn 分布,記為分布,記為

16、的的為為所服從的分布為自由度所服從的分布為自由度)()(1),()1(212222nxnxniii 則則若若獨立,則獨立,則21222121,),(),()2(xxnxnx ).(21221nnxx .,2)(,)(),()3(2nxdnxenx分布的分位點分布的分位點2).4( )(222)()(ndyyfnp, 10 ,對于給定的正數對于給定的正數稱滿足條件稱滿足條件.381.34)25()(.)()(20.1222 可通過查表求,例可通過查表求,例如圖所示如圖所示分位點,分位點,分布的上分布的上為為的點的點nnn)(2n 386,25, 1 . 0pn見見 概率密度函數為:概率密度函數為

17、: tntnnnthn212)1()2(2)1()( 定義定義: 設設xn(0,1) , y , 且且x與與y相互相互 獨立,則稱變量獨立,則稱變量nyxt 所服從的分布為自由度為所服從的分布為自由度為 n的的 t 分布分布.)(2n).(ntt記為記為分布的密度分布的密度分布又稱為學生氏分布分布又稱為學生氏分布)(. ntt分布分布t. 2分布的性質:分布的性質:t)2()2()(, 0)(),(. 1 nnntdtentttn與與方方差差為為:其其數數學學期期望望分分布布的的具具有有自自由由度度為為.21)(lim,.0. 222tnethntt 函數的性質有函數的性質有由由再再分布概率密

18、度的圖形,分布概率密度的圖形,其圖形近似于標準正態其圖形近似于標準正態充分大時充分大時當當對稱對稱分布的密度函數關于分布的密度函數關于).1 , 0(ntn近似近似足夠大時,足夠大時,即當即當分布分布t. 2.)()(如圖所示如圖所示分位點分位點分布的上分布的上為為的點的點 ntnt)(nt )()()(ntdtthnttp稱滿足條件稱滿足條件,對于給定的對于給定的分布的分位點分布的分位點, 10. 3 t)(nt )()(1ntntt 分位點的性質:分位點的性質:分布的上分布的上.1315. 2)15(p285)(025. 0 tntt求得,例求得,例可查表見可查表見分位點分位點分布的上分布

19、的上 zntn)(45的值,可用正態近似的值,可用正態近似時,對于常用的時,對于常用的當當由定義可見,由定義可見,3、f分布分布121nunvf f(n2,n1)分布分布f. 3服從自由度為服從自由度為n1及及 n2 的的f分布,分布,n1稱為第自稱為第自由度,由度,n2稱為第二自由度,記作稱為第二自由度,記作21nvnuf ff(n1,n2) .則稱隨機變量則稱隨機變量定義:設定義:設),(),(2212nvnu 三、幾個重要的抽樣分布定理三、幾個重要的抽樣分布定理有有和樣本方差和樣本方差則樣本均值則樣本均值來自總體的一個樣本,來自總體的一個樣本,是是,方差為,方差為的均值為的均值為設總體設

20、總體2212,xsxxxxn 2(),(),e xd xn 22)()( xdse 定理定理 1 (樣本均值的分布樣本均值的分布) 設設 x1, x2, , xn 是來自正態總體是來自正態總體),(2 n的樣本,的樣本, 是樣本均值,則有是樣本均值,則有),(2nnx ) 1 , 0( nnx 即即x)本均值本均值已知,可由該定理求樣已知,可由該定理求樣,(若正態總體的(若正態總體的x2 0 1( , )xnn n取不同值時樣本取不同值時樣本均值均值 的分布的分布x請注意請注意 :),(2nnx 定理定理 2 (樣本方差的分布樣本方差的分布) 1() 1() 1 (222nsn 設設x1,x2

21、,xn是來自正態總體是來自正態總體),(2 n的樣本的樣本,2sx和分別為樣本均值和樣本方差分別為樣本均值和樣本方差, 則有則有.)2(2獨獨立立與與sxn取不同值時取不同值時 的分布的分布22) 1(sn )本方差本方差已知,可由該定理求樣已知,可由該定理求樣,(若正態總體的(若正態總體的22s 定理定理 3 (樣本均值的分布樣本均值的分布) 設設x1,x2,xn是取自正態總體是取自正態總體),(2 n的樣本的樣本,2sx和分別為樣本均值和樣本方差分別為樣本均值和樣本方差,則有則有) 1(ntnsx 且相互獨立且相互獨立分布的定義可得分布的定義可得、由定理由定理證證)1()1(,)1 , 0

22、(t2,1222 nsnnnx)1()1(22 ntsnnx則則 iixnxns2222211s.x(的值是的值是這里樣本方差這里樣本方差本均值本均值時,可用本定理計算樣時,可用本定理計算樣,在未知總體在未知總體 .),3 . 0 , 0(,. 23;,n(0,1)x. 1210122101232221232221321nxccnxxxxxxxxxxxxxiii分布,并求自由度分布,并求自由度服從服從使使的值,的值,求求獨立同分布,獨立同分布,設設是樣本,則是樣本,則,設總體設總體例例 )3(2 )3( t),1 , 0(3 . 0,3 . 03 . 03 . 0)()3 . 0(222nxx

23、dxdiii )10(3 . 03 . 03 . 022102221 xxx)10(3 . 012122 iix09. 01c分布分布,使得服從,使得服從求常數求常數,來自總體來自總體設樣本設樣本226542321621c)()()1 , 0(,. 3 xxxxxxynxxx )3 , 0(),3 , 0(654321nxxxnxxx )1 , 0(3),1 , 0(3654321nxxxnxxx )2(32 y31 c上的均勻分布。上的均勻分布。分布分布的樣本,求的樣本,求來自總體來自總體設設例例2 , 0. 2;)10(. 1)(),(),(),(21 xxsexdxexxxn ,)(,)(. 1pqxdpxe 解解 niixnx11)()(1)(;)(1)(212senpqxdnxdpxnenxeni 342)(;2e(x). 22202220 dxxxedxx解解)(3)()()(2222sexexexd nxdnxdxnenxeni3)(1)(;)(1)(212 的概率。的概率。于于樣本均值差的絕對值大樣本均值差的絕對值大的兩獨立的兩獨立的容量分別為的容量分別為求總體求總體例例3 . 015,10)3 ,20(ny,為為解:兩樣本均值分別記解:兩樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論