統(tǒng)計學 抽樣與抽樣分布_第1頁
統(tǒng)計學 抽樣與抽樣分布_第2頁
統(tǒng)計學 抽樣與抽樣分布_第3頁
統(tǒng)計學 抽樣與抽樣分布_第4頁
統(tǒng)計學 抽樣與抽樣分布_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1第四章 抽樣與抽樣分布(新)4.1 抽樣的基礎(chǔ)知識4.2 抽樣分布 4.3 中心極限定理的應(yīng)用24.1 抽樣的基礎(chǔ)知識一、 幾個概念二、抽樣誤差三、常用的抽樣方法3一、幾個概念(一)全及總體與總體指標(一)全及總體與總體指標全及總體全及總體。簡稱總體簡稱總體(Population)(Population),是指所要研究的,是指所要研究的對象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)對象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全部單位所組成的集合體。總體單位總數(shù)用的全部單位所組成的集合體。總體單位總數(shù)用N N表示。表示。(舉例)(舉例) 總體指標總體指標(參數(shù))。在抽樣估計中,用來反映總體

2、數(shù)(參數(shù))。在抽樣估計中,用來反映總體數(shù)量特征的指標稱為總體指標,也叫總體參數(shù)。量特征的指標稱為總體指標,也叫總體參數(shù)。研究目的一經(jīng)確定,總體也唯一地確定了,所以總體研究目的一經(jīng)確定,總體也唯一地確定了,所以總體指標的數(shù)值是客觀存在的、確定的,但又是未知的,指標的數(shù)值是客觀存在的、確定的,但又是未知的,需要用樣本資料去估計需要用樣本資料去估計。4通常所要估計的總體指標有通常所要估計的總體指標有: :變量總體變量總體總體平均數(shù)總體平均數(shù) ( (或記為或記為 )總體標準差總體標準差或方差或方差總體標志總量總體標志總量 (N )(N )屬性總體屬性總體總體比率(成數(shù))總體比率(成數(shù))P(P(或或 )

3、 )總體比率標準差總體比率標準差P P或或 方差方差P P 總體中具有某一屬性的單總體中具有某一屬性的單位總數(shù)位總數(shù)(NP)(NP)等。等。 XX5一、 幾個概念(二)樣本總體與樣本指標(二)樣本總體與樣本指標樣本總體樣本總體。簡稱樣本(。簡稱樣本(SampleSample),它是按照隨機原則,),它是按照隨機原則,從總體中抽取的部分總體單位的集合體從總體中抽取的部分總體單位的集合體 。樣本容量樣本容量:樣本中所包含的個體的數(shù)量,一般用:樣本中所包含的個體的數(shù)量,一般用n n表示。表示。在實際工作中,人們通常把在實際工作中,人們通常把n30n30的樣本稱為大樣本的樣本稱為大樣本,而把而把n30

4、n30的樣本稱為小樣本的樣本稱為小樣本。對于某一既定的總體,由于抽樣的方式方法不同,樣對于某一既定的總體,由于抽樣的方式方法不同,樣本容量也可大可小,因而,本容量也可大可小,因而,樣本是不確定的、而是可樣本是不確定的、而是可變的變的。6一、 幾個概念(二)樣本總體與樣本指標(二)樣本總體與樣本指標樣本指標(統(tǒng)計量)樣本指標(統(tǒng)計量)。在抽樣估計中,用來反。在抽樣估計中,用來反映映樣本總體樣本總體數(shù)量特征的指標數(shù)量特征的指標稱為樣本指標,也稱為樣本指標,也稱為樣本統(tǒng)計量或估計量,是根據(jù)樣本資料計稱為樣本統(tǒng)計量或估計量,是根據(jù)樣本資料計算的、用以估計或推斷相應(yīng)總體指標的綜合指算的、用以估計或推斷相

5、應(yīng)總體指標的綜合指標。標。7常見的樣本統(tǒng)計量有:常見的樣本統(tǒng)計量有:變量總體變量總體: :樣本平均數(shù)樣本平均數(shù)樣本標準差樣本標準差S S或或 樣本方差樣本方差SS樣本統(tǒng)計量樣本統(tǒng)計量不含未知參數(shù)不含未知參數(shù),它是隨樣本不同而不同的它是隨樣本不同而不同的隨機變量隨機變量。屬性總體:屬性總體:樣本比率(也稱樣本樣本比率(也稱樣本 成數(shù))成數(shù))p p樣本比率標準差樣本比率標準差p p或或 方差方差p p x8二、 抽樣誤差(一)抽樣誤差的概念(一)抽樣誤差的概念抽樣誤差是統(tǒng)計調(diào)查誤差的一種形式。統(tǒng)計調(diào)查誤差,是指調(diào)查所得結(jié)果與總體真實統(tǒng)計調(diào)查誤差,是指調(diào)查所得結(jié)果與總體真實數(shù)值之間的差異。在抽樣調(diào)查

6、中,誤差的來源數(shù)值之間的差異。在抽樣調(diào)查中,誤差的來源有兩大類:有兩大類: 登記性誤差登記性誤差。是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生。是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生. . 代表性誤差代表性誤差 系統(tǒng)性誤差系統(tǒng)性誤差 隨機誤差隨機誤差9二、抽樣誤差系統(tǒng)性誤差,系統(tǒng)性誤差,是由于非隨機因素引起的樣本代是由于非隨機因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)性偏高或偏低,故也稱偏差;值系統(tǒng)性偏高或偏低,故也稱偏差;隨機誤差隨機誤差:又稱偶然性誤差,是指:又稱偶然性誤差,是指遵循隨機原遵循隨機原則抽樣,但由于樣本各單位的結(jié)構(gòu)不足以代表則抽樣,但由于樣本

7、各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu)而引起的樣本估計量與總體總體各單位的結(jié)構(gòu)而引起的樣本估計量與總體參數(shù)之間的誤差參數(shù)之間的誤差。這就是抽樣估計中所謂的抽。這就是抽樣估計中所謂的抽樣誤差樣誤差 。 10二、抽樣誤差實際應(yīng)用中,有三個密切聯(lián)系而又相互區(qū)別實際應(yīng)用中,有三個密切聯(lián)系而又相互區(qū)別的抽樣誤差的概念的抽樣誤差的概念 實際抽樣誤差實際抽樣誤差 抽樣平均誤差抽樣平均誤差 抽樣極限誤差抽樣極限誤差11二、抽樣誤差(二)抽樣平均誤差(抽樣標準誤(二)抽樣平均誤差(抽樣標準誤)抽樣平均誤差是反映抽樣誤差一般水平的指標(抽樣平均誤差是反映抽樣誤差一般水平的指標(因為因為抽樣誤差是一個隨機變量,它的

8、數(shù)值隨著可能抽取的抽樣誤差是一個隨機變量,它的數(shù)值隨著可能抽取的樣本不同而或大或小,為了總的衡量樣本代表性的高樣本不同而或大或小,為了總的衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平低,就需要計算抽樣誤差的一般水平)。通常用)。通常用樣本樣本估計量的標準差估計量的標準差來反映來反映所有可能樣本估計值與其中心所有可能樣本估計值與其中心值的平均離散程度。值的平均離散程度。 12二、抽樣誤差(二)抽樣平均誤差(二)抽樣平均誤差22( )()( )x E xxxMMn抽樣平均誤差可衡量樣本對總體的代表性大小抽樣平均誤差可衡量樣本對總體的代表性大小。即即:抽樣平均誤越小,則樣本估計量的分布就越集抽

9、樣平均誤越小,則樣本估計量的分布就越集中在總體參數(shù)的附近,平均來說,樣本估計值與總中在總體參數(shù)的附近,平均來說,樣本估計值與總體參數(shù)之間的抽樣誤差越小,樣本對總體的代表性體參數(shù)之間的抽樣誤差越小,樣本對總體的代表性越大。越大。13抽樣平均誤的計算公式抽樣平均誤的計算公式在總體方差在總體方差 已知,總體單位總數(shù)為已知,總體單位總數(shù)為N N,樣本,樣本容量為容量為n n,簡單隨機抽樣條件下,抽樣平均誤,簡單隨機抽樣條件下,抽樣平均誤的計算公式為的計算公式為: 重復抽樣重復抽樣 不重復抽樣不重復抽樣估計均值估計均值估計成數(shù)估計成數(shù)22( ) xnn2( )1nxnN(1)( )pppn(1)( )1

10、ppnpnN14二、抽樣誤差(三)抽樣極限誤差(三)抽樣極限誤差抽樣極限誤差是指抽樣極限誤差是指一定概率下一定概率下抽樣誤差的抽樣誤差的可能范圍可能范圍,也稱為也稱為允許誤差允許誤差。用。用表示,由定義知其表達式:表示,由定義知其表達式:在一定概率下,在一定概率下, 上式表示,在一定概率下可認為樣本估計量與相應(yīng)的上式表示,在一定概率下可認為樣本估計量與相應(yīng)的總體參數(shù)的誤差的絕對值不超過總體參數(shù)的誤差的絕對值不超過 。 15抽樣極限誤差抽樣極限誤差用用 、 分別表示平均數(shù)和比率(成數(shù))的抽樣極限分別表示平均數(shù)和比率(成數(shù))的抽樣極限誤差,則在一定概率下有:誤差,則在一定概率下有:估計均值的置信區(qū)

11、間:估計均值的置信區(qū)間:估計成數(shù)(比例)的置信區(qū)間:估計成數(shù)(比例)的置信區(qū)間: xpxXxpPpxxxXx pppPp 16對抽樣極限誤差的解釋:抽樣極限誤差抽樣極限誤差是抽樣誤差的是抽樣誤差的可能范圍可能范圍,而不是完全肯,而不是完全肯定的范圍。所以,這一可能范圍的大小是與其估計的定的范圍。所以,這一可能范圍的大小是與其估計的可靠程度的大小(即概率)緊密聯(lián)系的。在抽樣估計可靠程度的大小(即概率)緊密聯(lián)系的。在抽樣估計中,這個概率叫置信度,習慣上也稱為可靠程度、把中,這個概率叫置信度,習慣上也稱為可靠程度、把握程度或概率保證程度等,用握程度或概率保證程度等,用1-1-表示。表示。顯然在其他顯

12、然在其他條件不變的情況下,抽樣極限誤差越大,相應(yīng)的置信條件不變的情況下,抽樣極限誤差越大,相應(yīng)的置信度也就越大。度也就越大。17抽樣誤差率:抽樣誤差率:與抽樣極限誤差相關(guān)的兩個概念是與抽樣極限誤差相關(guān)的兩個概念是: : 抽樣誤差率和抽樣估計精度抽樣誤差率和抽樣估計精度抽樣誤差率抽樣誤差率= =(抽樣極限誤差(抽樣極限誤差/ /估計量)估計量)100%100%抽樣估計精度抽樣估計精度=100%-=100%-抽樣誤差率抽樣誤差率18估計精度(準確性)與可靠程度的關(guān)系:估計精度與估計的可靠程度是矛盾的。也就是說,如估計精度與估計的可靠程度是矛盾的。也就是說,如果果精度很高精度很高,則會由于估計區(qū)間太

13、窄而使錯誤估計的,則會由于估計區(qū)間太窄而使錯誤估計的可能性大增,從而大大降低估計的可靠程度,使估計可能性大增,從而大大降低估計的可靠程度,使估計結(jié)果沒有多大的作用;如果結(jié)果沒有多大的作用;如果置信度很高置信度很高,則意味著允,則意味著允許誤差范圍較大,而使估計精度太低許誤差范圍較大,而使估計精度太低 ,這時盡管估計,這時盡管估計的可靠程度接近或等于的可靠程度接近或等于100%100%,但抽樣估計本身也會失,但抽樣估計本身也會失去意義。去意義。實際中,只能依據(jù)具體情況,先滿足一方面,然后確實際中,只能依據(jù)具體情況,先滿足一方面,然后確定另一方面。定另一方面。19三、抽樣方法在實際應(yīng)用中,抽樣方法

14、主要有兩種在實際應(yīng)用中,抽樣方法主要有兩種 概率抽樣概率抽樣 非概率抽樣非概率抽樣1 1、概率抽樣也叫隨機抽樣概率抽樣也叫隨機抽樣,是指按隨機原則抽取樣本。,是指按隨機原則抽取樣本。所謂隨機原則,就是排除主觀意識的干擾,使總體的每所謂隨機原則,就是排除主觀意識的干擾,使總體的每一個單位都有一定的概率被抽選為樣本單位,每個單位一個單位都有一定的概率被抽選為樣本單位,每個單位能否入選是隨機的。能否入選是隨機的。概率抽樣最基本的組織形式有概率抽樣最基本的組織形式有: 簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣。簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣。20三、抽樣方法1 1、概率抽樣概率抽樣特點特

15、點:概率抽樣能有效地避免主觀選樣帶來的傾向性:概率抽樣能有效地避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使得抽樣估計和推斷得以建立在誤差(系統(tǒng)偏差),使得抽樣估計和推斷得以建立在概率論和數(shù)理統(tǒng)計的科學理論之上。從而使樣本資料概率論和數(shù)理統(tǒng)計的科學理論之上。從而使樣本資料一方面能夠用于估計和推斷總體的數(shù)量特征;一方面能夠用于估計和推斷總體的數(shù)量特征; 另一方面可以計算和控制抽樣誤差,說明估計的可靠另一方面可以計算和控制抽樣誤差,說明估計的可靠程度。程度。 2 2、非概率抽樣也叫非隨機抽樣非概率抽樣也叫非隨機抽樣,是指從研究目的出發(fā),是指從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗或判斷,從總體中根據(jù)調(diào)查者的

16、經(jīng)驗或判斷,從總體中有意識地有意識地抽取若抽取若干單位構(gòu)成樣本。干單位構(gòu)成樣本。21三、抽樣方法由于一般的抽樣推斷都是建立在概率抽樣的基由于一般的抽樣推斷都是建立在概率抽樣的基礎(chǔ)上,因此,主要介紹四種常見的抽樣組織形礎(chǔ)上,因此,主要介紹四種常見的抽樣組織形式。式。簡單隨機抽樣類型抽樣等距抽樣整群抽樣22(一)簡單隨機抽樣(一)簡單隨機抽樣簡單隨機抽樣又稱簡單隨機抽樣又稱純隨機抽樣純隨機抽樣,它是對總體單位不進,它是對總體單位不進行任何劃分或排隊,行任何劃分或排隊,完全隨機地直接完全隨機地直接從總體中抽取樣從總體中抽取樣本單位,使每個總體單位都有完全均等的機會被抽中。本單位,使每個總體單位都有完

17、全均等的機會被抽中。純隨機抽樣常采用的純隨機抽樣常采用的抽選方法抽選方法有抽簽法、利用隨機數(shù)有抽簽法、利用隨機數(shù)表取數(shù)法和電子計算機取數(shù)法。它只需對總體單位進表取數(shù)法和電子計算機取數(shù)法。它只需對總體單位進行編號,而不需要事先掌握更多的總體信息。行編號,而不需要事先掌握更多的總體信息。 23(一)簡單隨機抽樣(一)簡單隨機抽樣純隨機抽樣有兩種純隨機抽樣有兩種抽取單位抽取單位的具體方法,即:的具體方法,即:重復抽樣重復抽樣,又稱回置抽樣,是指從總體的,又稱回置抽樣,是指從總體的N N個單位中,每次抽個單位中,每次抽取一個單位后,再將其放回總體中參加下一次抽選,這樣連續(xù)抽取一個單位后,再將其放回總體

18、中參加下一次抽選,這樣連續(xù)抽n n次,即得到一個樣本。次,即得到一個樣本。其特點是其特點是:樣本是由:樣本是由n n次次相互獨立相互獨立的連續(xù)試驗構(gòu)成的,每次試驗的連續(xù)試驗構(gòu)成的,每次試驗是在是在完全相同完全相同的條件下進行,每個單位中選的機會在各次都完全的條件下進行,每個單位中選的機會在各次都完全相等。相等。“重抽重抽”(考慮順序)可能的樣本數(shù)目(從總體中可能抽取的樣(考慮順序)可能的樣本數(shù)目(從總體中可能抽取的樣本個數(shù),用本個數(shù),用M M表示)為:表示)為:N Nn n個。個。不重復抽樣不重復抽樣,也叫不回置抽樣,是指抽中的單位不再放回總體,也叫不回置抽樣,是指抽中的單位不再放回總體中,下

19、一個樣本單位只能從余下的總體單位中抽取。中,下一個樣本單位只能從余下的總體單位中抽取。其特點是其特點是:樣本由:樣本由n n次連續(xù)抽取次連續(xù)抽取的結(jié)果構(gòu)成,實際上等于一次同的結(jié)果構(gòu)成,實際上等于一次同時從總體中抽取時從總體中抽取n n個樣本單位。個樣本單位。 可能的樣本數(shù)目(考慮順序):可能的樣本數(shù)目(考慮順序): N(N-1)(N-2)N(N-1)(N-2)(N-n+1)(N-n+1)個。個。24(一)簡單隨機抽樣(一)簡單隨機抽樣優(yōu)缺點:純隨機抽樣比較適用于總體單位數(shù)不多,總純隨機抽樣比較適用于總體單位數(shù)不多,總體單位標志值的差異不很大,或?qū)Τ闃油茢嗟囊蟛惑w單位標志值的差異不很大,或?qū)Τ?/p>

20、樣推斷的要求不十分高的情況下使用。但由于純隨機抽樣的估計效率十分高的情況下使用。但由于純隨機抽樣的估計效率比較低,進行大規(guī)模的抽樣調(diào)查時,其組織工作也不比較低,進行大規(guī)模的抽樣調(diào)查時,其組織工作也不宜開展,故大規(guī)模抽調(diào)常采用其他三種組織形式。宜開展,故大規(guī)模抽調(diào)常采用其他三種組織形式。25(二)分層抽樣(二)分層抽樣分層抽樣分層抽樣又稱類型抽樣或分類抽樣。這種抽樣方式又稱類型抽樣或分類抽樣。這種抽樣方式是先對總體各單位按是先對總體各單位按主要標志主要標志加以分組,然后再從各加以分組,然后再從各組中按隨機原則抽選一定單位構(gòu)成樣本。如城市職工組中按隨機原則抽選一定單位構(gòu)成樣本。如城市職工收入調(diào)查,

21、可按行業(yè)將全部職工分類,再從各行業(yè)中收入調(diào)查,可按行業(yè)將全部職工分類,再從各行業(yè)中分別抽取若干職工進行調(diào)查。分別抽取若干職工進行調(diào)查。類型抽樣總的抽樣誤差與組間差異無關(guān),僅取決于各類型抽樣總的抽樣誤差與組間差異無關(guān),僅取決于各組內(nèi)組內(nèi)的抽樣誤差,而組內(nèi)的抽樣誤差又取決于各組內(nèi)的抽樣誤差,而組內(nèi)的抽樣誤差又取決于各組內(nèi)的方差水平。的方差水平。 所以,類型抽樣所以,類型抽樣應(yīng)該盡可能擴大組間方應(yīng)該盡可能擴大組間方差,縮小組內(nèi)方差,這樣就可以減少抽樣誤差,以提差,縮小組內(nèi)方差,這樣就可以減少抽樣誤差,以提高抽樣效果。高抽樣效果。26(二)分層抽樣(二)分層抽樣分層抽樣的優(yōu)點:1、不僅能對總體進行估計

22、,而且也可對各層子總體進行估計。2、能使抽樣的組織和實施都比較方便。因為分層時可按自然區(qū)域或行政區(qū)域進行。3、能使樣本在總體中的分布比較均勻。因為類型抽樣是對所有的層進行全面抽樣。4、估計精度高。因為分層抽樣的誤差只與組內(nèi)方差有關(guān),因此,若分類效果好,則可減少抽樣誤差。27(三)等距抽樣(三)等距抽樣等距抽樣也稱機械抽樣。它是等距抽樣也稱機械抽樣。它是先先將總體所有單位按將總體所有單位按某一標志順序某一標志順序排列,排列,然后然后按按相等相等的距離抽取樣本單位。的距離抽取樣本單位。 排列的標志可以是排列的標志可以是無關(guān)標志無關(guān)標志也可以是也可以是有關(guān)標志有關(guān)標志。(1 1)無關(guān)標志無關(guān)標志,指

23、和單位標志值的大小無關(guān)或不起主要的影響作指和單位標志值的大小無關(guān)或不起主要的影響作用。用。 (2 2)有關(guān)標志有關(guān)標志,指作為排隊順序的標志和單位標志值的大小有密指作為排隊順序的標志和單位標志值的大小有密切的關(guān)系。切的關(guān)系。 其中,按有關(guān)標志順序排隊,并將樣本單位加以其中,按有關(guān)標志順序排隊,并將樣本單位加以n n等份后,對每一等份后,對每一部分抽取一個樣本單位有兩種方法部分抽取一個樣本單位有兩種方法 半距中點取樣半距中點取樣 對稱等距取樣對稱等距取樣 應(yīng)該指出的是,等距取樣間隔的確定,要避免與想象中的應(yīng)該指出的是,等距取樣間隔的確定,要避免與想象中的周期性周期性節(jié)奏重合節(jié)奏重合,引起系統(tǒng)誤差

24、的影響。,引起系統(tǒng)誤差的影響。 28(三)等距抽樣(三)等距抽樣等距抽樣的優(yōu)點:等距抽樣的優(yōu)點:1 1、簡便易行。相對于簡單隨機抽樣而言。簡便易行。相對于簡單隨機抽樣而言。2 2、誤差相對而言,比簡單隨機抽樣的要小。因為等距、誤差相對而言,比簡單隨機抽樣的要小。因為等距抽樣的樣本在總體中的分布一般比較均勻(針對有關(guān)抽樣的樣本在總體中的分布一般比較均勻(針對有關(guān)標志排隊而言)標志排隊而言)。29(四)整群抽樣(四)整群抽樣整群抽樣整群抽樣又稱又稱群體抽樣群體抽樣。它是將總體各單位劃分成它是將總體各單位劃分成許多群,然后從中隨機抽取部分群,并對許多群,然后從中隨機抽取部分群,并對中選群的所中選群的

25、所有單位進行全面調(diào)查有單位進行全面調(diào)查。 整群抽樣整群抽樣實質(zhì)上實質(zhì)上是是以以“群群”代替單位代替單位之后的純隨機抽之后的純隨機抽樣。因此,整群抽樣的抽樣平均誤差可以根據(jù)群間方樣。因此,整群抽樣的抽樣平均誤差可以根據(jù)群間方差來推算。差來推算。 30(四)整群抽樣(四)整群抽樣優(yōu)點:1、不需要有總體單位的具體名稱,而群的名單比較容易得到。2、整群抽樣調(diào)查單位比較集中,故調(diào)查較方便,節(jié)省費用。3、若群內(nèi)各單位存在較大差異時,抽樣推斷效果較好。314.2 抽樣分布一、一、 抽樣分布的概念抽樣分布的概念二、二、 抽樣分布的形式抽樣分布的形式三、三、 抽樣分布的特征抽樣分布的特征四、四、 樣本比率的抽樣

26、分布樣本比率的抽樣分布五、五、 樣本方差的抽樣分布樣本方差的抽樣分布六、六、 兩個樣本統(tǒng)計量的抽樣分布兩個樣本統(tǒng)計量的抽樣分布xx32一、 抽樣分布的概念樣本指標是一種隨機變量,它有若干可能取值,每樣本指標是一種隨機變量,它有若干可能取值,每個可能取值都有一定的可能性(即概率),從而形成個可能取值都有一定的可能性(即概率),從而形成它的概率分布,即統(tǒng)計上所謂的抽樣分布。簡言之,它的概率分布,即統(tǒng)計上所謂的抽樣分布。簡言之, 抽樣分布就是指抽樣分布就是指樣本統(tǒng)計量樣本統(tǒng)計量的概率分布的概率分布。樣本統(tǒng)計量是由樣本統(tǒng)計量是由n n個隨機變量構(gòu)成的函數(shù),故抽樣分布個隨機變量構(gòu)成的函數(shù),故抽樣分布屬于

27、隨機變量函數(shù)的分布。屬于隨機變量函數(shù)的分布。33一、 抽樣分布的概念舉例舉例: : 四名學生的月生活費支出(四名學生的月生活費支出(480480,560560,720720,800 800 元)。現(xiàn)按不重復取樣的方法,隨機抽取兩位構(gòu)元)。現(xiàn)按不重復取樣的方法,隨機抽取兩位構(gòu)成一個樣本,則全部可能的樣本及其各樣本的均值如成一個樣本,則全部可能的樣本及其各樣本的均值如下表所示:下表所示:34序序 樣本變量樣本變量 樣本平均數(shù)樣本平均數(shù) 平均數(shù)離差平均數(shù)離差 離差平方離差平方 x -x -E( E( ) -) -E( E( ) 1 480 1 480,560 520 -120 14400560 52

28、0 -120 14400 2 480 2 480,720 600 -40 1600720 600 -40 1600 3 480 3 480,800 640 0 0800 640 0 0 4 560 4 560,480 520 -120 14400480 520 -120 14400 5 560 5 560,720 640 0 0720 640 0 0 6 560 6 560,800 680 40 1600800 680 40 1600 7 720 7 720,480 600 -40 1600480 600 -40 1600 8 720 8 720,560 640 0 0560 640 0 0

29、9 720 9 720,800 760 120 14400800 760 120 1440010 80010 800,480 640 0 0480 640 0 011 80011 800,560 680 40 1600560 680 40 160012 80012 800,720 760 120 14400720 760 120 14400合計合計 7680 0 64000 7680 0 64000 xxxxx35一、 抽樣分布的概念(續(xù))樣本平均數(shù)的概率分布樣本平均數(shù)的概率分布 520 600 640 680 760 f 2 2 4 2 2f/f 2/12 2/12 4/12 2/12 2/

30、12x36一、 抽樣分布的概念(續(xù))例中總體分布和樣本均值分布的比較: P( )xx37一、抽樣分布的概念(續(xù))通過圖通過圖4.1總體分布和圖總體分布和圖4.2樣本均值的抽樣樣本均值的抽樣分布的比較,不難看出:盡管總體為均勻分分布的比較,不難看出:盡管總體為均勻分布,但樣本均值的抽樣分布在形狀上卻是對布,但樣本均值的抽樣分布在形狀上卻是對稱的。稱的。38一、一、 抽樣分布的抽樣分布的概念概念(續(xù)續(xù)) 抽樣分布的形成過程抽樣分布的形成過程可概括為圖可概括為圖4.3:xxx39抽樣分布反映了樣本指標的分布特征,是抽樣推斷抽樣分布反映了樣本指標的分布特征,是抽樣推斷的重要依據(jù)的重要依據(jù)。根據(jù)樣本分布

31、的規(guī)律,可揭示樣本指標。根據(jù)樣本分布的規(guī)律,可揭示樣本指標與總體指標之間的關(guān)系,估計抽樣誤差,并說明抽樣與總體指標之間的關(guān)系,估計抽樣誤差,并說明抽樣推斷的可靠程度。推斷的可靠程度。40二、二、 抽樣分布的抽樣分布的形式形式 抽樣分布的形式與原有總體的分布和樣本容量抽樣分布的形式與原有總體的分布和樣本容量n的大小有關(guān)。的大小有關(guān)。(1)若總體的分布是正態(tài)分布,且方差已知若總體的分布是正態(tài)分布,且方差已知,則無論樣本容量,則無論樣本容量是大是小,樣本均值的抽樣分布都服從正態(tài)分布。是大是小,樣本均值的抽樣分布都服從正態(tài)分布。(2)若總體的分布是非正態(tài)分布,則要看樣本容量的大小若總體的分布是非正態(tài)分

32、布,則要看樣本容量的大小。當樣本容量是大樣本當樣本容量是大樣本(通常通常n 30),無論原來的總體是否),無論原來的總體是否服從正態(tài)分布,樣本均值的抽樣分布都將趨于正態(tài)分布,其分布服從正態(tài)分布,樣本均值的抽樣分布都將趨于正態(tài)分布,其分布的的數(shù)學期望數(shù)學期望為:總體均值為:總體均值 ;方差方差為總體方差的為總體方差的1/n,即:,即: /n。當當n n為小樣本為小樣本(通常(通常n 30n 30)時,其分布則不是正態(tài)分布,則不)時,其分布則不是正態(tài)分布,則不能按照正態(tài)分布進行推斷。能按照正態(tài)分布進行推斷。xx241二、二、 抽樣分布的抽樣分布的形式(形式(續(xù))樣本均值的抽樣分布與總體分布的關(guān)系可

33、概括為圖樣本均值的抽樣分布與總體分布的關(guān)系可概括為圖4.44.4。x42三、三、 抽樣分布的抽樣分布的特征特征從統(tǒng)計推斷的角度看,人們所關(guān)心的從統(tǒng)計推斷的角度看,人們所關(guān)心的抽樣分布的特征抽樣分布的特征主要有主要有均值均值和和方差方差。而這兩個特征又與以下兩個問題。而這兩個特征又與以下兩個問題有關(guān):有關(guān):(1)總體分布的均值和方差;)總體分布的均值和方差;(2)樣本的抽樣方法(即重復抽樣還是不重復抽樣)樣本的抽樣方法(即重復抽樣還是不重復抽樣)x43三、 抽樣分布的特征(續(xù))假設(shè)一個總體,其單位總數(shù)為假設(shè)一個總體,其單位總數(shù)為N,均值,均值 ,方差為,方差為。從中抽取樣本容量為從中抽取樣本容量

34、為n n的樣本,樣本均值的的樣本,樣本均值的數(shù)學期望數(shù)學期望為為E( ),E( ),樣本均值的樣本均值的方差方差為為( )( )。 對對樣本均值樣本均值 的數(shù)學期望而言,無論是重復抽樣還是不的數(shù)學期望而言,無論是重復抽樣還是不重復抽樣,重復抽樣, E( )= E( )= 。 對樣本均值的方差對樣本均值的方差 ( ) ( ) 而言,則與抽樣方法有關(guān)。而言,則與抽樣方法有關(guān)。(前述抽樣平均誤已總結(jié)過前述抽樣平均誤已總結(jié)過)xxxxxx44三、 抽樣分布的特征(續(xù))即:重復抽樣下重復抽樣下, 不重復抽樣下不重復抽樣下, 說明說明:對于:對于無限總體無限總體進行不重復抽樣時,可按重復抽樣計算;進行不重

35、復抽樣時,可按重復抽樣計算; 對于對于有限總體有限總體,當,當N N很大而很大而n n很小時(一般而言,抽樣比很小時(一般而言,抽樣比 n/Nn/N 5%),其修正系數(shù)),其修正系數(shù) 也趨近于也趨近于1 1,所以也按重復,所以也按重復 計算即可。計算即可。12NnNnx1NnNnx22)()(2x45四、 樣本比率p的抽樣分布P的抽樣分布是樣本比率的抽樣分布是樣本比率p的所有可能取值的概率分布。的所有可能取值的概率分布。當當樣本容量很大樣本容量很大時,樣本比率的抽樣分布近似于正態(tài)分時,樣本比率的抽樣分布近似于正態(tài)分布。對于一個具體的樣本比率布。對于一個具體的樣本比率p,若,若np 5和和n(1

36、-p) 5,即可認為樣本容量足夠大。,即可認為樣本容量足夠大。P P的分布特征的分布特征:(1)p的數(shù)學期望的數(shù)學期望E(p)等于總體比率等于總體比率 ,即:,即: E(p)=46四、 樣本比率p的抽樣分布(續(xù))(2)P的方差。(的方差。(與抽樣方法有關(guān))與抽樣方法有關(guān))重復抽樣, 不重復抽樣,np)1 (2)()(2p1n)1 (NNn47五、五、樣本方差樣本方差的抽樣分布的抽樣分布用用樣本方差樣本方差 去推斷去推斷總體的方差總體的方差 ,也必須知道,也必須知道樣樣本方差的抽樣分布本方差的抽樣分布。在在重復重復選取選取容量為容量為n的樣本時,由樣本方差的所有可能的樣本時,由樣本方差的所有可能

37、取值形成的相對頻數(shù)分布,稱為樣本方差的抽樣分布取值形成的相對頻數(shù)分布,稱為樣本方差的抽樣分布。教材p100的樣本方差 的抽樣分布為:2s2s2 的取值 0 0.5 2 4.5 頻數(shù)f 4 6 4 2頻率f/f 4/16 6/16 4/16 2/16 2s48五、五、 樣本方差樣本方差的抽樣分布的抽樣分布(續(xù))統(tǒng)計證明,對于來自正態(tài)總體的簡單隨機樣本,作為估統(tǒng)計證明,對于來自正態(tài)總體的簡單隨機樣本,作為估計量的計量的樣本方差的分布樣本方差的分布是:是:比值比值 的抽樣分布服從自由度為(的抽樣分布服從自由度為(n-1)的)的 分布,即:分布,即: 221sn )( 22221sn)( )(12n4

38、9五、五、樣本方差樣本方差的抽樣分布的抽樣分布(續(xù)) 分布具有四個特征分布具有四個特征 (教材(教材p108) 分布通常用于分布通常用于總體方差的估計和非參數(shù)總體方差的估計和非參數(shù)檢驗檢驗。 2250樣本統(tǒng)計量的抽樣分布形式概括:樣本統(tǒng)計量的抽樣分布形式概括: x2x2s51六、兩個樣本統(tǒng)計量的抽樣分布六、兩個樣本統(tǒng)計量的抽樣分布52問題的提出:o1、甲、乙兩臺機床同時加工某種同類型的零件,已知兩機床加工甲、乙兩臺機床同時加工某種同類型的零件,已知兩機床加工的零件直徑(單位:的零件直徑(單位:cm)分別服從正態(tài)分布)分別服從正態(tài)分布 o ,并且有,并且有 。為比較兩臺機床。為比較兩臺機床的加工

39、精度有無顯著性差異,分別獨立抽取了甲機床的的加工精度有無顯著性差異,分別獨立抽取了甲機床的8個零件和個零件和乙機床的乙機床的7個零件,通過測量得到的數(shù)據(jù)見表:個零件,通過測量得到的數(shù)據(jù)見表:o 兩臺機床加工零件的樣本數(shù)據(jù)兩臺機床加工零件的樣本數(shù)據(jù) 單位:單位:cmo在在 的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持“兩臺機床加工兩臺機床加工的零件直徑不一致的零件直徑不一致”的看法?的看法?221122(,),(,)NN2212機床機床 零件直徑零件直徑甲甲20.520.519.819.819.719.720.420.420.120.12020191919.9

40、19.9乙乙20.720.719.819.819.519.520.820.820.420.419.619.620.220.20.0553o2、某飲料公司開發(fā)研制出一新產(chǎn)品,為比較消費者對新老產(chǎn)品口感的滿、某飲料公司開發(fā)研制出一新產(chǎn)品,為比較消費者對新老產(chǎn)品口感的滿意程度,該公司隨機抽取一組消費者(意程度,該公司隨機抽取一組消費者(8人),每個消費者先品嘗一種飲人),每個消費者先品嘗一種飲料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機的,然后每個消料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機的,然后每個消費者要對兩種飲料分別進行評分(費者要對兩種飲料分別進行評分(010分)分) ,評分

41、結(jié)果如表所示:,評分結(jié)果如表所示:o 兩種飲料平均等級的樣本數(shù)據(jù)兩種飲料平均等級的樣本數(shù)據(jù)o取顯著性水平取顯著性水平=0.05,該公司是否有證據(jù)認為消費者對兩種飲料的評分存,該公司是否有證據(jù)認為消費者對兩種飲料的評分存在顯著性差異?在顯著性差異? 消費者消費者 編號編號1 12 23 34 45 56 67 78 8評價等級評價等級舊款飲料舊款飲料5 54 47 73 35 58 85 56 6新款飲料新款飲料6 66 67 74 43 39 97 76 654o3、假定兩個辦事處納稅申報單的獨立簡單隨機樣本提供的資料如假定兩個辦事處納稅申報單的獨立簡單隨機樣本提供的資料如下表所示:下表所示:

42、o o 納稅申報單中有錯申報數(shù)納稅申報單中有錯申報數(shù)o要求:在顯著性水平要求:在顯著性水平=0.01下,檢驗兩辦事處納稅申報單的有錯比下,檢驗兩辦事處納稅申報單的有錯比例是否相等。例是否相等。辦事處1n1=250有錯申報數(shù)=35辦事處2n2=300有錯申報數(shù)=2755六、兩個樣本統(tǒng)計量的抽樣分布六、兩個樣本統(tǒng)計量的抽樣分布現(xiàn)實中,若對現(xiàn)實中,若對兩個總體參數(shù)進行推斷時,所關(guān)心的總體兩個總體參數(shù)進行推斷時,所關(guān)心的總體參數(shù)主要是:參數(shù)主要是: 兩個總體均值之差兩個總體均值之差 ( ),), 兩個總體比率之差兩個總體比率之差 ( ),), 兩個總體的方差比兩個總體的方差比 。相應(yīng)地,用于推斷這些參

43、數(shù)的統(tǒng)計量分別是:相應(yīng)地,用于推斷這些參數(shù)的統(tǒng)計量分別是: 兩個樣本均值之差兩個樣本均值之差 兩個樣本比率之差兩個樣本比率之差 兩個樣本方差比兩個樣本方差比121212()xx12()pp2212/2212/ss56六、兩個樣本統(tǒng)計量的抽樣分布(六、兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù))為此,需分別研究兩個總體參數(shù)推斷時為此,需分別研究兩個總體參數(shù)推斷時樣本樣本統(tǒng)計量的抽樣分布統(tǒng)計量的抽樣分布,包括:,包括:兩個樣本均值之差的抽樣分布兩個樣本均值之差的抽樣分布兩個樣本比率之差的抽樣分布兩個樣本比率之差的抽樣分布兩個樣本方差比的抽樣分布兩個樣本方差比的抽樣分布57六、六、 兩個樣本統(tǒng)計量的抽樣分布(兩

44、個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù))1、兩個樣本均值之差的抽樣分布兩個樣本均值之差的抽樣分布 從兩個總體中分別從兩個總體中分別獨立地獨立地抽取容量為抽取容量為 的樣的樣本,在本,在重復重復選取選取容量為容量為 的樣本時,由兩個的樣本時,由兩個樣本均值之差的所有可能取值形成的相對頻數(shù)分布,樣本均值之差的所有可能取值形成的相對頻數(shù)分布,稱為兩個樣本均值之差的抽樣分布。稱為兩個樣本均值之差的抽樣分布。 12nn和12nn和58六、六、 兩個樣本統(tǒng)計量的抽樣分布(兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù)) 當兩個總體都為當兩個總體都為正態(tài)分布正態(tài)分布時時,即,即 , 兩個樣本均值之差兩個樣本均值之差 的抽樣分布服從正

45、態(tài)分的抽樣分布服從正態(tài)分 布,即:布,即: 12()xx22121212(,)Nnn2111(,)XN 2222(,)XN12()xx59 對分布的解釋:對分布的解釋:這表明,兩個樣本均值之差的抽樣分布,其均值是這表明,兩個樣本均值之差的抽樣分布,其均值是兩個總體均值之差,即:兩個總體均值之差,即: 抽樣分布的方差抽樣分布的方差 為各自樣本均值為各自樣本均值分布的方差之和,即:分布的方差之和,即: 1212()E xx12()xx122xx122221212xxnn60六、兩個樣本統(tǒng)計量的抽樣分布(六、兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù)) 另一種情況是:另一種情況是:若兩個總體為若兩個總體為非正態(tài)

46、分布非正態(tài)分布,當,當 比較大時,比較大時,即即大樣本大樣本,則兩個樣本均值之差的抽樣分布仍然,則兩個樣本均值之差的抽樣分布仍然可以用正態(tài)分布來近似可以用正態(tài)分布來近似。12nn和61六、六、 兩個樣本統(tǒng)計量的抽樣分布(兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù))2、兩個樣本比率之差的抽樣分布兩個樣本比率之差的抽樣分布從兩個服從二項分布的總體中,分別從兩個服從二項分布的總體中,分別獨立獨立地抽取容量地抽取容量為為 的樣本,的樣本,在在重復選取重復選取容量為容量為 的樣本的樣本時,由兩個樣本比率之差的所有可能取值形成的相對時,由兩個樣本比率之差的所有可能取值形成的相對頻數(shù)分布,稱為兩個樣本比率之差的抽樣分布

47、。頻數(shù)分布,稱為兩個樣本比率之差的抽樣分布。 當兩個樣本均來自于服從二項分布的兩個總體,且都為當兩個樣本均來自于服從二項分布的兩個總體,且都為 大樣本大樣本,則兩個樣本比率之差的抽樣分布可用正態(tài)分,則兩個樣本比率之差的抽樣分布可用正態(tài)分布來近似,其分布的均值和方差分別為:布來近似,其分布的均值和方差分別為:12nn和12nn和62六、兩個樣本統(tǒng)計量的抽樣分布(六、兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù)) 即: 1212()E pp122112212(1)(1)ppnn12()pp11221212(1)(1),Nnn63六、兩個樣本統(tǒng)計量的抽樣分布(六、兩個樣本統(tǒng)計量的抽樣分布(續(xù)續(xù)) 3、兩個樣本方差比的抽樣分布兩個樣本方差比的抽樣分布從兩個總體中分別從兩個總體中分別獨立地獨立地抽取容量為抽取容量為 的樣本,的樣本,在在重復選取重復選取容量為容量為 的樣本時,由兩個樣本方差的樣本時,由兩個樣本方差比的所有可能取值形成的相對頻數(shù)分布,稱為兩個樣比的所有可能取值形成的相對頻數(shù)分布,稱為兩個樣本方差比的抽樣分布。本方差比的抽樣分布。 設(shè)兩個總體都為設(shè)兩個總體都為正態(tài)分布,正態(tài)分布,分別從兩個總體抽取樣本分別從兩個總體抽取樣本容量為容量為 的獨立樣本,則兩個樣本方差比的獨立樣本,則兩個樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論