統(tǒng)計學(xué)之抽樣與抽樣估計概述課件_第1頁
統(tǒng)計學(xué)之抽樣與抽樣估計概述課件_第2頁
統(tǒng)計學(xué)之抽樣與抽樣估計概述課件_第3頁
統(tǒng)計學(xué)之抽樣與抽樣估計概述課件_第4頁
統(tǒng)計學(xué)之抽樣與抽樣估計概述課件_第5頁
已閱讀5頁,還剩109頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章

抽樣與抽樣估計第九章

抽樣與抽樣估計第1節(jié)抽樣與抽樣分布

一、有關(guān)抽樣的基本概念

總體(Population)

研究對象的全體稱為總體樣本(子樣)(Sample)

從總體中抽取一部分個體進(jìn)行試驗或觀察,這種從總體中抽取個體的行為稱為抽樣。而從總體中抽樣所得的一部分個體叫樣本總體參數(shù)(Populationparameter)

描述總體分布特征的數(shù)值樣本統(tǒng)計量(Samplestatistic)第1節(jié)抽樣與抽樣分布

一、有關(guān)抽樣的基本概念

總體(P抽樣方法

重置抽樣(重復(fù)抽樣)(Samplingwithreplacement)

要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每次從總體中抽取一個單位,把順序號登記下來之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。不重置抽樣(不重復(fù)抽樣)(Samplingwithoutreplacement)

要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每次從總體中抽取一個單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復(fù)抽樣。

抽樣方法重置抽樣(重復(fù)抽樣)(Samplingwith抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進(jìn)行抽樣,如果容量為n的每個可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機(jī)樣本。分層抽樣:也稱分類抽樣或類型抽樣,它是按某個主要標(biāo)志對總體各單位進(jìn)行分類,然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。整群抽樣:也稱叢聚抽樣或集團(tuán)抽樣。它是將總體分為若干部分(每一部分稱為一個群),然后按隨機(jī)原則從中一群一群地抽選,對抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。系統(tǒng)抽樣也稱機(jī)械抽樣。它是先將總體單位按一定順序排隊,計算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從總體分布

(populationdistribution)總體分布

(populationdistribution)樣本分布

(sampledistribution)一個樣本中各觀察值的分布也稱經(jīng)驗分布當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本樣本分布

(sampledistribution)一個樣本統(tǒng)計學(xué)之抽樣與抽樣估計概述課件二、抽樣分布

(Samplingdistribution)

1、抽樣分布的意義

對統(tǒng)計量的所有可能取值及其對應(yīng)概率的描述,就是統(tǒng)計量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計量與總體參數(shù)之間的關(guān)系,計算抽樣誤差,并說明抽樣推斷的可靠程度。

二、抽樣分布

(Samplingdistribution)抽樣誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差登記性誤差是指在調(diào)查和匯總過程中由于觀察、測量、登記、計算等方法的差錯或被調(diào)查者提供虛假資料而造成的誤差。任何一種統(tǒng)計調(diào)查都可能產(chǎn)生登記性誤差。代表性誤差是指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致、樣本不能完全代表總體而產(chǎn)生的誤差。系統(tǒng)性誤差是指由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)偏低或偏高。。隨機(jī)性誤差又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,由于隨機(jī)因素(偶然性因素)引起的誤差。抽樣估計中的所謂抽樣誤差,就是指的這種隨機(jī)誤差。抽樣誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性抽樣誤差登記性誤差:存在于一切調(diào)查中代表性誤差:僅產(chǎn)生于抽樣調(diào)查,不可避免。代表性誤差抽樣誤差在實際一次調(diào)查中是調(diào)查不出來的,但其平均值是可以推算的系統(tǒng)性誤差:不隨樣本量增減而變化隨機(jī)誤差(抽樣誤差):隨樣本量增大而減小抽樣誤差登記性誤差:存在于一切調(diào)查中系統(tǒng)性誤差:不隨樣本量增抽樣平均誤差和抽樣極限誤差抽樣平均誤差:所有可能的樣本指標(biāo)與總體指標(biāo)間的平均差異程度。抽樣平均誤差和抽樣極限誤差抽樣平均誤差:所有可能的樣本指標(biāo)與抽樣極限誤差樣本指標(biāo)與總體指標(biāo)之間允許的誤差范圍叫抽樣極限誤差。也稱抽樣允許誤差。它是樣本指標(biāo)可允許變動的上限或下限與總體指標(biāo)之差的絕對值。即:抽樣極限誤差樣本指標(biāo)與總體指標(biāo)之間允許的誤差范圍叫抽落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73%的樣本x-368.27%的樣本x-2x-X+3X+2X+x落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73大數(shù)定律及中心極限定理重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本

容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布大數(shù)定律及中心極限定理重復(fù)抽樣:例:樣本均值的抽樣分布

【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為X1=1、X2=2、X3=3

、X4=4

。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差例:樣本均值的抽樣分布

【例】設(shè)一個總體,含有4個元素(個體現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有4*4=16個樣本。所有樣本的結(jié)果為

3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有4計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布

3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布

3.樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X樣本均值的分布與總體分布的比較=2.5總體分布1大數(shù)定律及中心極限定理不重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本

容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布大數(shù)定律及中心極限定理不重復(fù)抽樣:抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差抽樣平均誤差(1)比例重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。在其他條件不變的情況下,總體標(biāo)志的變異程度愈小,則抽樣誤差也愈小;總體標(biāo)志的變異程度愈大,則抽樣誤差也愈大。抽樣單位數(shù)的多少。在其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈小;抽樣單位數(shù)愈少,抽樣誤差愈大。抽樣的方法。在其他條件不變的情況下,重復(fù)抽樣的抽樣誤差大于不重復(fù)抽樣。抽樣的組織形式。抽樣誤差的大小與樣本單位數(shù)的平方根成反比:如果抽樣誤差要減少二分之一,則樣本單位數(shù)必須增大到4倍。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。例、從某校1000名學(xué)生中簡單隨機(jī)抽取50名學(xué)生,稱得平均體重為50千克,若已知總體標(biāo)準(zhǔn)差為10千克,計算重復(fù)抽樣及不重復(fù)抽樣下抽樣平均誤差。解:重復(fù)抽樣條件下,不重復(fù)抽樣條件下,

在樣本量相同的情況下,不重復(fù)抽樣的平均誤差要小于重復(fù)抽樣的平均誤差。例、從某校1000名學(xué)生中簡單隨機(jī)抽取50名學(xué)生,稱得平均體第3節(jié)總體平均數(shù)和總體比例的估計抽樣估計必須包括三要素:1)估計值2)估計值的誤差范圍3)概率保證程度(置信度)第3節(jié)總體平均數(shù)和總體比例的估計抽樣估計必須包括三要素:一、點估計(Pointestimate)點估計也稱定值估計,常用點估計方法有矩估計,極大似然估計。樣本均值是總體均值的點估計量,樣本方差s2是總體方差σ2的點估計量,樣本比例p是總體比例P的點估計量。優(yōu)良估計量的標(biāo)準(zhǔn):無偏性有效性一致性統(tǒng)計學(xué)之抽樣與抽樣估計概述課件區(qū)間估計就是根據(jù)樣本求出總體未知參數(shù)的估計區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1)

總體方差σ2已知時由于,所以對于給定的置信度1-α,有即可見,極限誤差的計算公式為則總體均值的置信區(qū)間為區(qū)間估計就是根據(jù)樣本求出總體未知參數(shù)的估計區(qū)間,并使其可靠程例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計算,得到平均體重為58千克。根據(jù)過去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。

解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)

=1.96×1=1.96(千克)置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計算

(2)

總體方差σ2未知時

由于~t(n-1),對于給定的置信度1-α,有置信下限置信上限在大樣本下,總體均值的置信區(qū)間為(2)

總體方差σ2未知時

由于例:某保險公司投保人年齡設(shè)某保險公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計該保險公司投保人的平均年齡。

解:當(dāng)置信度為95%時,=2.26222.6544=6.00(歲)因為40.7-6.00=34.740.7+6.00=46.7所以該保險公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。

例:某保險公司投保人年齡設(shè)某保險公司投保人年齡呈正態(tài)分布,現(xiàn)總體比例的區(qū)間估計在大樣本條件下,若np>5,n(1-p)>5,則樣本比例趨近于正態(tài)分布。對于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。總體比例的區(qū)間估計在大樣本條件下,若np>5,n(1-p)>例:總體比例的區(qū)間估計

【例】某城市想要估計下崗職工中女性所占的比例,隨機(jī)抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

例:總體比例的區(qū)間估計

【例】某城市想要估計下崗職工中女性所例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,隨機(jī)重復(fù)抽取樣品100只,樣本合格品率為95%,試計算把握程度為90%的合格品率置信區(qū)間。

解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.96

=0.0218

Δp=zα/2=1.96×0.0218=0.0359或3.59%

95%-3.59%=91.41%,95%+3.59%=98.59%

故該批產(chǎn)品合格率的置信區(qū)間為(91.41%,98.59%)例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,隨機(jī)重復(fù)抽取樣品100只,樣第5節(jié)樣本容量的確定

在重復(fù)抽樣下,

所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)

第5節(jié)樣本容量的確定

例:某市進(jìn)行職工家庭生活費抽樣調(diào)查,已知職工家庭平均每人每月生活費收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。

解:例:某市進(jìn)行職工家庭生活費抽樣調(diào)查,已知職工家庭平均每人每月【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?

解:【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為20影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時,允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計的可靠程度1-α。當(dāng)其他條件不變時,抽樣估計的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個原因。影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時本章小結(jié)總體分布、樣本分布、抽樣分布單總體參數(shù)推斷時樣本統(tǒng)計量的分布參數(shù)估計的一般問題一個總體參數(shù)的區(qū)間估計樣本容量的確定本章小結(jié)總體分布、樣本分布、抽樣分布期末考試大綱第九章抽樣與抽樣估計抽樣調(diào)查中的基本概念;總體均值與成數(shù)的簡單估計;必要樣本量的計算不作考試要求。期末考試大綱第九章抽樣與抽樣估計知識重點:抽樣方法重置抽樣不重置抽樣注意:不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復(fù)抽樣。知識重點:抽樣方法抽樣的組織方式簡單隨機(jī)抽樣:分層抽樣:整群抽樣:系統(tǒng)抽樣也稱機(jī)械抽樣。抽樣的組織方式簡單隨機(jī)抽樣:40誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差42抽樣平均誤差(2)比例重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差43影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。抽樣單位數(shù)的多少。抽樣的方法。

抽樣的組織形式。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。(1)

總體方差σ2已知時總體均值的置信區(qū)間為區(qū)間估計其中極限誤差為(1)

總體方差σ2已知時區(qū)間估計其中極限誤差為45

(2)

總體方差σ2未知時

總體均值的置信區(qū)間為其中極限誤差為(2)

總體方差σ2未知時

總體均值46總體比例的區(qū)間估計總體比例的置信區(qū)間為總體比例的區(qū)間估計47第5節(jié)樣本容量的確定

在重復(fù)抽樣下,

所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)

第5節(jié)樣本容量的確定

48影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時,允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計的可靠程度1-α。當(dāng)其他條件不變時,抽樣估計的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個原因。影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時49練習(xí):某電子元件廠生產(chǎn)A型號的電子管,現(xiàn)從10000件產(chǎn)品中,抽取100件進(jìn)行檢驗,結(jié)果是60件合格。計算合格品率的抽樣平均誤差。練習(xí):某電子元件廠生產(chǎn)A型號的電子管,現(xiàn)從10000件產(chǎn)品中練習(xí):對一批電子元件進(jìn)行耐用性能的檢查,隨機(jī)重置抽樣方法選取100件作耐用測試,所得結(jié)果的分組資料如下:耐用時數(shù)(小時)組中值(x)件數(shù)(f)900以下

875

1900—950

925

2950—1000

975

61000—10501025

351050—11001075

431100—11501125

91150—12001175

31200以上1225

1合計—100練習(xí):對一批電子元件進(jìn)行耐用性能的檢查,隨機(jī)重置抽樣方法選取要求:在95.45%的可靠程度下對該批電子元件的平均耐用時數(shù)作出估計。概率保證程度為95.45%,t值為2。要求:在95.45%的可靠程度下對該批電子元件的平均耐用時數(shù)估計區(qū)間的下限:1055.5-10.38=1045.12小時估計區(qū)間的上限:1055.5+10.38=1065.88小時所以,這批電子元件的平均耐用時數(shù)在1045.12小時至1065.88小時之間,可靠程度為95.45%。統(tǒng)計學(xué)之抽樣與抽樣估計概述課件以上例的資料,設(shè)電子元件的耐用時間在1000小時及以上為合格品,以95.45%的概率估計該批電子元件的合格率。以上例的資料,設(shè)電子元件的耐用時間在1000小時及以上為合格區(qū)間估計:估計的下限:91%-5.72%=85.28%估計的上限:91%+5.72%=96.72%

所以,這批電子元件的合格品率在85.28%至96.72%之間,可靠程度為95.45%。區(qū)間估計:近2年期末試題(計算題)1、某企業(yè)采用簡單隨機(jī)重復(fù)抽樣,在1000件產(chǎn)品中抽查200件,其中不合格品10件,要求:(1)求抽樣平均誤差;(5分)(2)以95.45%的置信度對該批產(chǎn)品不合格率進(jìn)行區(qū)間估計。(5分)近2年期末試題(計算題)1、某企業(yè)采用簡單隨機(jī)重復(fù)抽樣,在12、某企業(yè)有1500個工人,用簡單隨機(jī)重復(fù)抽樣的方法抽出50個工人作為樣本,調(diào)查其產(chǎn)量水平,資料如下,根據(jù)以前經(jīng)驗,標(biāo)準(zhǔn)差為35,要求:(1)計算樣本平均數(shù)和抽樣平均誤差。(5分)(2)94.45%的可靠性估計該廠工人的月平均產(chǎn)量的區(qū)間。(5分)產(chǎn)量(件)520530540550560580600660工人數(shù)(人)4691086432、某企業(yè)有1500個工人,用簡單隨機(jī)重復(fù)抽樣的方法抽出5057第九章

抽樣與抽樣估計第九章

抽樣與抽樣估計第1節(jié)抽樣與抽樣分布

一、有關(guān)抽樣的基本概念

總體(Population)

研究對象的全體稱為總體樣本(子樣)(Sample)

從總體中抽取一部分個體進(jìn)行試驗或觀察,這種從總體中抽取個體的行為稱為抽樣。而從總體中抽樣所得的一部分個體叫樣本總體參數(shù)(Populationparameter)

描述總體分布特征的數(shù)值樣本統(tǒng)計量(Samplestatistic)第1節(jié)抽樣與抽樣分布

一、有關(guān)抽樣的基本概念

總體(P抽樣方法

重置抽樣(重復(fù)抽樣)(Samplingwithreplacement)

要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每次從總體中抽取一個單位,把順序號登記下來之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。不重置抽樣(不重復(fù)抽樣)(Samplingwithoutreplacement)

要從總體N個單位中隨機(jī)抽取一個容量為n的樣本,每次從總體中抽取一個單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復(fù)抽樣。

抽樣方法重置抽樣(重復(fù)抽樣)(Samplingwith抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進(jìn)行抽樣,如果容量為n的每個可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機(jī)樣本。分層抽樣:也稱分類抽樣或類型抽樣,它是按某個主要標(biāo)志對總體各單位進(jìn)行分類,然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。整群抽樣:也稱叢聚抽樣或集團(tuán)抽樣。它是將總體分為若干部分(每一部分稱為一個群),然后按隨機(jī)原則從中一群一群地抽選,對抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。系統(tǒng)抽樣也稱機(jī)械抽樣。它是先將總體單位按一定順序排隊,計算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。抽樣的組織方式簡單隨機(jī)抽樣:從總體中抽取樣本最常用的方法。從總體分布

(populationdistribution)總體分布

(populationdistribution)樣本分布

(sampledistribution)一個樣本中各觀察值的分布也稱經(jīng)驗分布當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本樣本分布

(sampledistribution)一個樣本統(tǒng)計學(xué)之抽樣與抽樣估計概述課件二、抽樣分布

(Samplingdistribution)

1、抽樣分布的意義

對統(tǒng)計量的所有可能取值及其對應(yīng)概率的描述,就是統(tǒng)計量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計量與總體參數(shù)之間的關(guān)系,計算抽樣誤差,并說明抽樣推斷的可靠程度。

二、抽樣分布

(Samplingdistribution)抽樣誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差登記性誤差是指在調(diào)查和匯總過程中由于觀察、測量、登記、計算等方法的差錯或被調(diào)查者提供虛假資料而造成的誤差。任何一種統(tǒng)計調(diào)查都可能產(chǎn)生登記性誤差。代表性誤差是指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致、樣本不能完全代表總體而產(chǎn)生的誤差。系統(tǒng)性誤差是指由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)偏低或偏高。。隨機(jī)性誤差又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,由于隨機(jī)因素(偶然性因素)引起的誤差。抽樣估計中的所謂抽樣誤差,就是指的這種隨機(jī)誤差。抽樣誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性抽樣誤差登記性誤差:存在于一切調(diào)查中代表性誤差:僅產(chǎn)生于抽樣調(diào)查,不可避免。代表性誤差抽樣誤差在實際一次調(diào)查中是調(diào)查不出來的,但其平均值是可以推算的系統(tǒng)性誤差:不隨樣本量增減而變化隨機(jī)誤差(抽樣誤差):隨樣本量增大而減小抽樣誤差登記性誤差:存在于一切調(diào)查中系統(tǒng)性誤差:不隨樣本量增抽樣平均誤差和抽樣極限誤差抽樣平均誤差:所有可能的樣本指標(biāo)與總體指標(biāo)間的平均差異程度。抽樣平均誤差和抽樣極限誤差抽樣平均誤差:所有可能的樣本指標(biāo)與抽樣極限誤差樣本指標(biāo)與總體指標(biāo)之間允許的誤差范圍叫抽樣極限誤差。也稱抽樣允許誤差。它是樣本指標(biāo)可允許變動的上限或下限與總體指標(biāo)之差的絕對值。即:抽樣極限誤差樣本指標(biāo)與總體指標(biāo)之間允許的誤差范圍叫抽落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73%的樣本x-368.27%的樣本x-2x-X+3X+2X+x落在總體均值某一區(qū)間內(nèi)的樣本X95.45%的樣本99.73大數(shù)定律及中心極限定理重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本

容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布大數(shù)定律及中心極限定理重復(fù)抽樣:例:樣本均值的抽樣分布

【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為X1=1、X2=2、X3=3

、X4=4

。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差例:樣本均值的抽樣分布

【例】設(shè)一個總體,含有4個元素(個體現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有4*4=16個樣本。所有樣本的結(jié)果為

3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有4計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布

3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布

3.樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X樣本均值的分布與總體分布的比較=2.5總體分布1大數(shù)定律及中心極限定理不重復(fù)抽樣:(1)總體是正態(tài)分布,樣本必然是正態(tài)分布(2)樣本平均數(shù)的平均數(shù)等于總體平均數(shù)(3)樣本平均數(shù)的方差等于總體方差除以樣本

容量n(4)n越大,樣本平均數(shù)越趨近于正態(tài)分布大數(shù)定律及中心極限定理不重復(fù)抽樣:抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差抽樣平均誤差(1)比例重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。在其他條件不變的情況下,總體標(biāo)志的變異程度愈小,則抽樣誤差也愈小;總體標(biāo)志的變異程度愈大,則抽樣誤差也愈大。抽樣單位數(shù)的多少。在其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈小;抽樣單位數(shù)愈少,抽樣誤差愈大。抽樣的方法。在其他條件不變的情況下,重復(fù)抽樣的抽樣誤差大于不重復(fù)抽樣。抽樣的組織形式。抽樣誤差的大小與樣本單位數(shù)的平方根成反比:如果抽樣誤差要減少二分之一,則樣本單位數(shù)必須增大到4倍。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。例、從某校1000名學(xué)生中簡單隨機(jī)抽取50名學(xué)生,稱得平均體重為50千克,若已知總體標(biāo)準(zhǔn)差為10千克,計算重復(fù)抽樣及不重復(fù)抽樣下抽樣平均誤差。解:重復(fù)抽樣條件下,不重復(fù)抽樣條件下,

在樣本量相同的情況下,不重復(fù)抽樣的平均誤差要小于重復(fù)抽樣的平均誤差。例、從某校1000名學(xué)生中簡單隨機(jī)抽取50名學(xué)生,稱得平均體第3節(jié)總體平均數(shù)和總體比例的估計抽樣估計必須包括三要素:1)估計值2)估計值的誤差范圍3)概率保證程度(置信度)第3節(jié)總體平均數(shù)和總體比例的估計抽樣估計必須包括三要素:一、點估計(Pointestimate)點估計也稱定值估計,常用點估計方法有矩估計,極大似然估計。樣本均值是總體均值的點估計量,樣本方差s2是總體方差σ2的點估計量,樣本比例p是總體比例P的點估計量。優(yōu)良估計量的標(biāo)準(zhǔn):無偏性有效性一致性統(tǒng)計學(xué)之抽樣與抽樣估計概述課件區(qū)間估計就是根據(jù)樣本求出總體未知參數(shù)的估計區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1)

總體方差σ2已知時由于,所以對于給定的置信度1-α,有即可見,極限誤差的計算公式為則總體均值的置信區(qū)間為區(qū)間估計就是根據(jù)樣本求出總體未知參數(shù)的估計區(qū)間,并使其可靠程例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計算,得到平均體重為58千克。根據(jù)過去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。

解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)

=1.96×1=1.96(千克)置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。例:從某大學(xué)學(xué)生中隨機(jī)抽取100名調(diào)查體重情況。經(jīng)稱量和計算

(2)

總體方差σ2未知時

由于~t(n-1),對于給定的置信度1-α,有置信下限置信上限在大樣本下,總體均值的置信區(qū)間為(2)

總體方差σ2未知時

由于例:某保險公司投保人年齡設(shè)某保險公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計該保險公司投保人的平均年齡。

解:當(dāng)置信度為95%時,=2.26222.6544=6.00(歲)因為40.7-6.00=34.740.7+6.00=46.7所以該保險公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。

例:某保險公司投保人年齡設(shè)某保險公司投保人年齡呈正態(tài)分布,現(xiàn)總體比例的區(qū)間估計在大樣本條件下,若np>5,n(1-p)>5,則樣本比例趨近于正態(tài)分布。對于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。總體比例的區(qū)間估計在大樣本條件下,若np>5,n(1-p)>例:總體比例的區(qū)間估計

【例】某城市想要估計下崗職工中女性所占的比例,隨機(jī)抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

例:總體比例的區(qū)間估計

【例】某城市想要估計下崗職工中女性所例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,隨機(jī)重復(fù)抽取樣品100只,樣本合格品率為95%,試計算把握程度為90%的合格品率置信區(qū)間。

解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.96

=0.0218

Δp=zα/2=1.96×0.0218=0.0359或3.59%

95%-3.59%=91.41%,95%+3.59%=98.59%

故該批產(chǎn)品合格率的置信區(qū)間為(91.41%,98.59%)例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,隨機(jī)重復(fù)抽取樣品100只,樣第5節(jié)樣本容量的確定

在重復(fù)抽樣下,

所以,必要抽樣單位數(shù)在不重復(fù)抽樣下,必要抽樣單位數(shù)

第5節(jié)樣本容量的確定

例:某市進(jìn)行職工家庭生活費抽樣調(diào)查,已知職工家庭平均每人每月生活費收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。

解:例:某市進(jìn)行職工家庭生活費抽樣調(diào)查,已知職工家庭平均每人每月【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?

解:【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為20影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時,允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計的可靠程度1-α。當(dāng)其他條件不變時,抽樣估計的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個原因。影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時本章小結(jié)總體分布、樣本分布、抽樣分布單總體參數(shù)推斷時樣本統(tǒng)計量的分布參數(shù)估計的一般問題一個總體參數(shù)的區(qū)間估計樣本容量的確定本章小結(jié)總體分布、樣本分布、抽樣分布期末考試大綱第九章抽樣與抽樣估計抽樣調(diào)查中的基本概念;總體均值與成數(shù)的簡單估計;必要樣本量的計算不作考試要求。期末考試大綱第九章抽樣與抽樣估計知識重點:抽樣方法重置抽樣不重置抽樣注意:不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復(fù)抽樣。知識重點:抽樣方法抽樣的組織方式簡單隨機(jī)抽樣:分層抽樣:整群抽樣:系統(tǒng)抽樣也稱機(jī)械抽樣。抽樣的組織方式簡單隨機(jī)抽樣:97誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差誤差:誤差登記性誤差代表性誤差系統(tǒng)性誤差隨機(jī)性誤差抽樣平均誤差(1)均值重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差99抽樣平均誤差(2)比例重復(fù)抽樣:不重復(fù)抽樣:抽樣平均誤差100影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。抽樣單位數(shù)的多少。抽樣的方法。

抽樣的組織形式。影響抽樣誤差大小的因素是:總體被研究標(biāo)志的變異程度。(1)

總體方差σ2已知時總體均值的置信區(qū)間為區(qū)間估計其中極限誤差為(1)

總體方差σ2已知時區(qū)間估計其中極限誤差為102

(2)

總體方差σ2未知時

總體均值的置信區(qū)間為其中極限誤差為(2)

總體方差σ2未知時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論