抽樣方法講稿精品課件_第1頁(yè)
抽樣方法講稿精品課件_第2頁(yè)
抽樣方法講稿精品課件_第3頁(yè)
抽樣方法講稿精品課件_第4頁(yè)
抽樣方法講稿精品課件_第5頁(yè)
已閱讀5頁(yè),還剩96頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于抽樣方法第一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 非概率抽樣的用途是有限的,因?yàn)槌檫x單元的傾向性不允許對(duì)調(diào)查總體進(jìn)行推斷。然而非概率抽樣快速簡(jiǎn)便,對(duì)探索性研究很有用,特別是在市場(chǎng)調(diào)查中應(yīng)用非常廣泛。第二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 一、非概率抽樣 非概率抽樣是用主觀的(非隨機(jī)的)方法從總體中抽選單元,是一種快速、簡(jiǎn)易且節(jié)省的從總體中選取樣本單元的方法。 要對(duì)總體進(jìn)行推斷需要對(duì)樣本進(jìn)行一些假定,即要求樣本對(duì)總體具有代表性。在這點(diǎn)上非概率抽樣一般不具備。第三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 由于非概率抽樣抽取樣本有傾向性與偏差且沒(méi)有一個(gè)抽樣框,不可能計(jì)算出各

2、個(gè)單元的入樣概率。從而無(wú)法得到總體目標(biāo)量的可靠估計(jì)值及其抽樣誤差估計(jì)值。第四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月非概率抽樣能用在下面幾個(gè)方面的研究中:用來(lái)形成一種想法;作為設(shè)計(jì)開(kāi)發(fā)概率抽樣調(diào)查的初始步驟;在后續(xù)步驟中幫助理解概率抽樣調(diào)查結(jié)果。有時(shí),非概率抽樣是唯一可行的選擇。例如,在醫(yī)學(xué)實(shí)驗(yàn)中,采用志愿者抽樣可能是取得數(shù)據(jù)的唯一途徑。第五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月非概率抽樣常被用于抽選參加焦點(diǎn)座談和深入訪(fǎng)問(wèn)的個(gè)人。另一個(gè)能較好發(fā)揮非概率抽樣作用的例子是預(yù)研究。第六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 非概率抽樣的優(yōu)點(diǎn)是:快速簡(jiǎn)便;費(fèi)用相對(duì)較低;不需要抽樣框;對(duì)

3、探索性研究和調(diào)查的設(shè)計(jì)開(kāi)發(fā)很有用。第七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月非概率抽樣的缺點(diǎn)是:為了對(duì)總體進(jìn)行推斷,需要對(duì)樣本的代表性做很強(qiáng)的假定。不可能得到可靠的估計(jì)值以及抽樣誤差估計(jì)值。第八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 非概率抽樣的種類(lèi) 非概率抽樣方法有五種:隨意抽樣自愿抽樣判斷抽樣配額抽樣修正的概率抽樣。第九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 1.隨意抽樣隨意抽樣的樣本單元的抽選以無(wú)目標(biāo)、隨意的方式進(jìn)行,幾乎沒(méi)有或完全沒(méi)有計(jì)劃。它假定總體是同質(zhì)的,即總體單元都相似。比如“街道攔截”訪(fǎng)問(wèn)法。第十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 2.志愿者抽樣 被

4、調(diào)查者都是志愿者。例如具有特定病情的人參加某些醫(yī)療實(shí)驗(yàn);打電話(huà)參與廣播或電視節(jié)目的人;抽選參加焦點(diǎn)座談或深入訪(fǎng)問(wèn)的人。第十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 3.判斷抽樣由專(zhuān)家有目的地抽選有代表性的樣本。它適用于探索性研究,如:抽選參加焦點(diǎn)座談或深入訪(fǎng)談的人,但不宜用在試調(diào)查中。第十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 4.配額抽樣 這是最常見(jiàn)的一種非概率抽樣。抽樣要從各個(gè)子總體中選取特定數(shù)量的單元(配額)。 總樣本量:900人18-2526-3031-3536-4041-45男女比例28%17%17%19%19%50-55%50-45%第十三張,PPT共一百零一頁(yè),創(chuàng)作

5、于2022年6月 1936年總統(tǒng)選舉預(yù)測(cè)得票率 單候 選 人 實(shí)際得票率 文摘雜志預(yù)測(cè) 蓋洛普預(yù)測(cè) 羅斯福 602 430 540 蘭 登 398 570 460 合 計(jì) 1000 1000 1000 那么,文摘雜志失敗,蓋洛普成功的原因究竟何在呢?第十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月蓋洛普采用的是一種叫作“分配法的方法。這種方法力求使調(diào)查對(duì)象在州,市,鎮(zhèn),村的大小,年齡,性別、社會(huì)階層,人種等方面,能準(zhǔn)確地代表美國(guó)的所有選民。例如,如果二十幾歲的人占全體選民的27%,那么在3000人的調(diào)查對(duì)象中,二十幾歲的人也應(yīng)占27%,即810人。為確保所分配的比率不致出錯(cuò),務(wù)必要求調(diào)查員直

6、接面見(jiàn)調(diào)查對(duì)象,以便確認(rèn)。因此,調(diào)查的實(shí)施多采取訪(fǎng)問(wèn)調(diào)查的方法。第十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 蓋洛普應(yīng)用分配法進(jìn)行總統(tǒng)選舉顱測(cè)調(diào)查獲得極大成功以后,該方法開(kāi)始被廣泛應(yīng)用于民意調(diào)查和市場(chǎng)調(diào)查。可是在1948年的總統(tǒng)選舉中,采用同樣方法預(yù)言杜威將當(dāng)選,結(jié)果與預(yù)測(cè)恰恰相反,杜魯門(mén)當(dāng)選了。 預(yù) 測(cè) 實(shí)際 候選人 Crossley Gallup Roper 結(jié)果杜魯門(mén) 45% 44% 38% 50%杜威 50% 50% 53% 45% 第十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 從此,蓋洛普失去了在民意調(diào)查界神話(huà)般的地位。不僅如此,其它調(diào)查機(jī)構(gòu)也都出現(xiàn)了同樣的失敗。人們開(kāi)始

7、向民意調(diào)查投來(lái)了懷疑的目光。于是,由許多學(xué)者和專(zhuān)家組成了一個(gè)委員會(huì),對(duì)失敗的原因進(jìn)行了研究。結(jié)果指出分配法的下列缺點(diǎn):第十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 采用分配法的目的最終在于使所抽選的調(diào)查對(duì)象能正確代表全體選民。可是分配法給予調(diào)查員的僅僅是這樣一些關(guān)于基本特征方面的框框;大城市30-40歲的白人男子多少人,大城市40-50歲的黑人女子多少人等等,只要是屬于這個(gè)框框之內(nèi)的人調(diào)查對(duì)象的最終確定就完全取決于調(diào)查員的個(gè)人判斷了。第十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 因此,不可避免調(diào)查員的愛(ài)好,調(diào)查對(duì)象對(duì)訪(fǎng)問(wèn)的配合程度等因素的影響。即使在年齡,社會(huì)階層等分配調(diào)查對(duì)象時(shí)考

8、慮到了的幾個(gè)特征上,調(diào)查對(duì)象能完全代表全體選民,但其他特征還是可能出現(xiàn)偏差。研究結(jié)果,隨機(jī)抽樣方法作為消除分配法主觀因素影響的手段開(kāi)始受到重視。第十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月蓋洛普后來(lái)的成功采用概率抽樣年份 樣本容量 獲勝后選人 蓋洛普 選舉結(jié)果 誤差 預(yù)測(cè)值 1952 5385 艾森豪威爾 51% 55.4% +4.4% 1956 8144 艾森豪威爾 59.5% 57.8% -1.7% 1960 8015 肯尼迪 51% 50.1% 0.1% 1964 6625 約翰遜 64% 61.3% -2.7% 1968 4414 尼克松 43% 43.5% 0.5% 1972

9、3689 尼克松 62% 61.8% -0.2% 1976 3439 卡特 49.5% 51.1% 1.6% 1980 3500 里根 55.3% 51.6% -3.7% 1984 3456 里根 59.0% 59.2% 0.2% 1988 4089 布什 56.0% 53.9% -2.1%第二十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 5. 修正的概率抽樣 修正的概率抽樣是概率抽樣與非概率抽樣的結(jié)合。主要用于多階段抽樣,前幾個(gè)階段用概率抽樣,最后用非概率抽樣,一般是配額抽樣。 第二十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 二、概率抽樣在需要根據(jù)樣本的結(jié)果對(duì)總體進(jìn)行推斷時(shí)應(yīng)使用概率

10、抽樣。最簡(jiǎn)單的概率抽樣設(shè)計(jì)是等概率抽樣,包括簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣。不等概率抽樣比較復(fù)雜且大多需要輔助抽樣框信息。不等概率抽樣有:概率與大小成比例的抽樣,整群抽樣,分層抽樣,多階段抽樣和多相抽樣。不等概率抽樣通常用來(lái)提高抽樣設(shè)計(jì)方案的效率,或降低抽樣費(fèi)用。 第二十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 概率抽樣有兩條基本準(zhǔn)則: 1) 單元是隨機(jī)抽取的; 2) 調(diào)查總體中的每個(gè)單元都有一個(gè)非零的入樣概率,并且能計(jì)算出這些概率。第二十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 概率抽樣的主要優(yōu)點(diǎn)有:能得到總體的可靠估計(jì)值并能計(jì)算每個(gè)估計(jì)值的抽樣誤差,因而能對(duì)總體進(jìn)行推斷。第二十四張,P

11、PT共一百零一頁(yè),創(chuàng)作于2022年6月 概率抽樣的主要缺點(diǎn)有:與非概率抽樣相比,概率抽樣比較復(fù)雜,更費(fèi)時(shí),通常也更費(fèi)錢(qián)。但總的說(shuō)來(lái),其利遠(yuǎn)大于弊。第二十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 概率抽樣的種類(lèi) 概率抽樣有七種:簡(jiǎn)單隨機(jī)抽樣,系統(tǒng)抽樣,等比例抽樣,整群抽樣,分層抽樣,多階抽樣,多相抽樣。第二十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 簡(jiǎn)單隨機(jī)抽樣(SRS)是所有概率抽樣的出發(fā)點(diǎn)和理論基礎(chǔ)。簡(jiǎn)單隨機(jī)抽樣是一種一步抽樣法,它保證樣本量為n的每個(gè)可能的樣本都有相同的被抽中的概率p=n/N。抽樣可以是放回的,也可以是不放回的。第二十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6

12、月 簡(jiǎn)單隨機(jī)樣本(圖示)第二十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月簡(jiǎn)單隨機(jī)抽樣在實(shí)際抽樣中應(yīng)用很少,常被用作評(píng)估其他抽樣方法的效率的標(biāo)準(zhǔn)。抽樣的誤差是通過(guò)其抽樣方差來(lái)測(cè)量的,如果一種抽樣方法的抽樣方差比另一種抽樣方法的抽樣方差小,我們就稱(chēng)這種抽樣方法更有效率(統(tǒng)計(jì)效率)。第二十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月與其他抽樣技術(shù)相比,簡(jiǎn)單隨機(jī)抽樣有以下優(yōu)點(diǎn):是最簡(jiǎn)單的抽樣技術(shù);抽樣框不需要其他(輔助)信息,唯一需要的只是一個(gè)關(guān)于調(diào)查總體所有單元的一個(gè)完全的清單和與其如何聯(lián)系的信息;關(guān)于樣本量的確定、總體估計(jì)與方差估計(jì)都有現(xiàn)成的標(biāo)準(zhǔn)公式可以利用,因此技術(shù)發(fā)展已經(jīng)成熟。第三十張,

13、PPT共一百零一頁(yè),創(chuàng)作于2022年6月 簡(jiǎn)單隨機(jī)抽樣的缺點(diǎn)是:抽樣框中即使有現(xiàn)成的輔助信息也不加利用,使得估計(jì)的統(tǒng)計(jì)效率較其他利用輔助信息的樣本設(shè)計(jì)低;由于樣本在總體中的地理分布范圍比較廣,如果采用面訪(fǎng),費(fèi)用較高;有可能抽到一個(gè)“差的”樣本;如果不用計(jì)算機(jī),而用隨機(jī)數(shù)表抽一個(gè)大樣本將十分單調(diào)勞神。 第三十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 系統(tǒng)抽樣(SYS)其抽樣單元是從總體中等距抽出的。它需要一個(gè)抽樣間距和一個(gè)隨機(jī)起點(diǎn)。抽樣間距是k=N/n,隨機(jī)起點(diǎn)r是介于1到k之間的一個(gè)隨機(jī)數(shù)。被抽中的單元是:r,r十k,r+2k,r+3k,r+(n-1)k。第三十二張,PPT共一百零一頁(yè),

14、創(chuàng)作于2022年6月 系統(tǒng)樣本(圖示)第三十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月在系統(tǒng)抽樣中,樣本單元是從總體中按一定的(抽樣)間距抽出的。如果N不能被n整除,則可以使用圓形系統(tǒng)抽樣法來(lái)避免出現(xiàn)可能樣本量不一致的情況。第三十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 系統(tǒng)抽樣有以下優(yōu)點(diǎn):在沒(méi)有抽樣框時(shí),可代替簡(jiǎn)單隨機(jī)抽樣;與簡(jiǎn)單隨機(jī)抽樣一樣,系統(tǒng)抽樣不需要輔助的抽樣框信息;與簡(jiǎn)單隨機(jī)抽樣相比,系統(tǒng)抽樣樣本的分布較好(這還取決于抽樣間隔及名錄是如何排列的);與簡(jiǎn)單隨機(jī)抽樣一樣,估計(jì)值容易計(jì)算;系統(tǒng)抽樣比簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單。第三十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月系統(tǒng)抽樣的

15、另一個(gè)優(yōu)點(diǎn)是,在事先沒(méi)有總體單元名錄的情況下,也可以用。此時(shí),我們可以使用并構(gòu)造一個(gè)概念抽樣框(只需要單元的排列順序),每隔k個(gè)抽一個(gè)單元直到總體的末尾。這種方法的一個(gè)缺點(diǎn)是,只有抽樣完成后才知道實(shí)際樣本量n。第三十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 系統(tǒng)抽樣的缺點(diǎn)有:如果抽樣間距正好碰上總體變化的某種未知的周期性,就會(huì)得到一個(gè)“差的”系統(tǒng)樣本;由于不使用抽樣框中的輔助信息,抽樣策略的效率不高;在使用概念框時(shí),不能預(yù)先知道最終樣本量;抽樣方差沒(méi)有一個(gè)無(wú)偏的估計(jì)量;在總體大小N不能被樣本量n整除且不使用圓形抽樣法時(shí),會(huì)得到樣本量不同的樣本。第三十七張,PPT共一百零一頁(yè),創(chuàng)作于202

16、2年6月與大小(或規(guī)模)成比例的概率(PPS)抽樣PPS抽樣是一種使用輔助信息從而使入樣概率不相等的抽樣技術(shù)。如果單元大小的度量是準(zhǔn)確的,而且所研究的變量與單元的大小相關(guān),PPS抽樣能極大地提高精度。PPS抽樣的一個(gè)很好的例子是商業(yè)調(diào)查。單元大小度量可用雇員數(shù)、年銷(xiāo)售額、經(jīng)營(yíng)場(chǎng)所數(shù)等。第三十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 在PPS抽樣中,單元的大小決定入樣概率的大小。這就是說(shuō),以農(nóng)場(chǎng)作為例子,一個(gè)面積為200公頃的農(nóng)場(chǎng)被抽入樣本的概率,是面積為100公頃的農(nóng)場(chǎng)的二倍。第三十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 假定一個(gè)總體有六個(gè)農(nóng)場(chǎng),我們要估計(jì)這個(gè)農(nóng)場(chǎng)總體的總支出。假

17、定我們已知每個(gè)農(nóng)場(chǎng)的規(guī)模(以公頃計(jì)的農(nóng)場(chǎng)大小),為便于說(shuō)明,進(jìn)一步假定我們已知它們的支出。第四十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月考慮下面的農(nóng)場(chǎng)名錄(總體值):抽樣單元:農(nóng)場(chǎng)抽樣框輔助信息:以公頃計(jì)的農(nóng)場(chǎng)規(guī)模調(diào)查變量:支出(元)15026000210004700003125638004300145000550023000062512500總計(jì)2000947300第四十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 對(duì)這個(gè)六個(gè)農(nóng)場(chǎng)的總體,真正的總支出為947,300元。假定我們沒(méi)有對(duì)這六個(gè)農(nóng)場(chǎng)進(jìn)行普查的經(jīng)費(fèi),預(yù)算只夠?qū)σ粋€(gè)農(nóng)場(chǎng)的樣本進(jìn)行調(diào)查(把樣本量取為1,只是為了說(shuō)明方便,在實(shí)際調(diào)查

18、中,只抽一個(gè)單元的情況極少),我們可以抽簡(jiǎn)單隨機(jī)樣本,每個(gè)樣本只含一個(gè)單元、每個(gè)單元入選的概率為16、大小為n=1的樣本有六種可能。第四十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 下面我們來(lái)分析簡(jiǎn)單隨機(jī)抽樣的結(jié)果。對(duì)大小為1的樣本,總體總支出的估計(jì)值,由抽中樣本的單元的支出乘以該單元的權(quán)數(shù)1/6(權(quán)數(shù)是樣本單元所代表的總體單元個(gè)數(shù))得到。第四十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月所有可能的n=1的簡(jiǎn)單隨機(jī)樣本。樣本(抽中的農(nóng)場(chǎng))農(nóng)場(chǎng)的如樣概率農(nóng)場(chǎng)的樣本權(quán)數(shù)農(nóng)場(chǎng)的支出(元)總體總支出的估計(jì)值(元)樣本11/6626000156000樣本21/664700002820000樣本31

19、/6663800382800樣本41/66145000870000樣本51/662300001380000樣本61/661250075000估計(jì)總值的平均數(shù)947300第四十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 用簡(jiǎn)單隨機(jī)抽樣時(shí),總體的估計(jì)值隨樣本的不同而不同,其變化范圍從75,000元到2,800,000元。PPS抽樣能得到抽樣變異性較小的估計(jì)值。第四十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月樣本(抽中的農(nóng)場(chǎng))農(nóng)場(chǎng)的如樣概率農(nóng)場(chǎng)的樣本權(quán)數(shù)農(nóng)場(chǎng)的支出(元)總體總支出的估計(jì)值(元)樣本150/20002000/50260001040000樣本21000/20002000/1000

20、470000940000樣本3125/20002000/125638001020800樣本4300/20002000/300145000966667樣本5500/20002000/500230000920000樣本625/20002000/25125001000000估計(jì)總值的平均數(shù)947300所有可能的n=1的PPS樣本第四十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月對(duì)PPS樣本,抽樣變異性要小得多。從六個(gè)可能的樣本得到的估計(jì)值的變化范圍,從最低的920,000元到最高的1,040,000元,比簡(jiǎn)單隨機(jī)樣本好得多(PPS抽樣的入樣概率是按農(nóng)場(chǎng)規(guī)模除以所有農(nóng)場(chǎng)總規(guī)模計(jì)算得到的)。第四十七張

21、,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 本例中假定農(nóng)場(chǎng)的支出與其規(guī)模(大小)有關(guān),這一假定在這里顯然是成立的,否則PPS抽樣不會(huì)這樣有效。實(shí)際上,如果調(diào)查變量與大小變量不相關(guān),PPS抽樣可能不比簡(jiǎn)單隨機(jī)抽樣好(甚至可能更差)。 PPS抽樣的主要優(yōu)點(diǎn)是它使用了輔助信息,提高了抽樣策略的統(tǒng)計(jì)效率,與簡(jiǎn)單隨機(jī)抽樣甚至與分層抽樣相比,都能顯著地減少抽樣誤差。第四十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 PPS抽樣的主要優(yōu)點(diǎn)是:由于使用了輔助信息,提高了抽樣策略的統(tǒng)計(jì)效率,能顯著地減少抽樣誤差。第四十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 PPS抽樣有以下的缺點(diǎn):抽樣框中的所有單元,

22、都要有高質(zhì)量的、能用作大小度量的輔助信息;抽樣框的創(chuàng)建比簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣成本高,更復(fù)雜,因?yàn)樾枰攘亢痛鎯?chǔ)總體中每一個(gè)單元的大小;并非在任何情況下都能使用,因?yàn)椴⒉皇敲恳粋€(gè)總體都有穩(wěn)定且與主要調(diào)查變量相關(guān)的有關(guān)大小或規(guī)模的度量;第五十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月抽樣及估計(jì)(特別對(duì)不放回抽樣)相當(dāng)復(fù)雜;當(dāng)單元大小度量不準(zhǔn)確或不穩(wěn)定時(shí)不適用,此時(shí)更好的辦法是將單元按大小分組并使用分層抽樣。第五十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 整群抽樣 整群抽樣中,總體單元被分為群,抽樣時(shí)先抽取群的樣本,調(diào)查被抽中的群中的所有單元。 采用整群抽樣的兩個(gè)理由:)抽選群能大大降低數(shù)

23、據(jù)收集的費(fèi)用,當(dāng)總體的分布比較廣且調(diào)查采用面訪(fǎng)時(shí)更是如此;)從總體中直接抽選個(gè)體在實(shí)際中并不總是可行的(沒(méi)有關(guān)于個(gè)體的抽樣框);第五十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 整群樣本(圖示)第五十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 整群抽樣策略的統(tǒng)計(jì)效率取決于群內(nèi)單元的相似程度有多大,每個(gè)群中有多少單元,及抽中群的數(shù)量。需要選擇最優(yōu)的群數(shù)量和大小,同時(shí)使總費(fèi)用最小。第五十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 整群抽樣的優(yōu)點(diǎn)有:由于樣本不如簡(jiǎn)單隨機(jī)樣本那樣分散,整群抽樣能大大降低數(shù)據(jù)收集的費(fèi)用;當(dāng)總體單元自然聚合成群(例如:住戶(hù)、學(xué)校)時(shí),整群抽樣比簡(jiǎn)單隨機(jī)抽樣或系

24、統(tǒng)抽樣更容易;如果對(duì)于調(diào)查變量而言,群內(nèi)單元差異較大,而不同群的差異較小,整群抽樣策略比簡(jiǎn)單隨機(jī)抽樣的統(tǒng)計(jì)效率更高。(例如為估計(jì)性別比采用按戶(hù)的整群抽樣);第五十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 整群抽樣的缺點(diǎn)有:對(duì)調(diào)查變量,若群內(nèi)單元有趨同性,則整群抽樣的統(tǒng)計(jì)效率比簡(jiǎn)單隨機(jī)抽樣低,(這正是通常遇到的情況),但對(duì)此項(xiàng)效率的損失可通過(guò)增加群的抽取個(gè)數(shù)來(lái)彌補(bǔ);通常無(wú)法提前知道調(diào)查總樣本量,因?yàn)樵谶M(jìn)行調(diào)查前,我們通常不知道一個(gè)群內(nèi)到底有多少個(gè)單元;方差估計(jì)可能比簡(jiǎn)單隨機(jī)抽樣更為復(fù)雜。第五十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 分層抽樣(STR)采用分層抽樣時(shí),總體被分為同質(zhì)的

25、、互不重迭的若干子總體(層),然后,在每一個(gè)層中獨(dú)立地抽取樣本。可以使用任何一種抽樣方法來(lái)對(duì)每個(gè)層進(jìn)行抽樣。第五十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 分層樣本(圖示)第五十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 進(jìn)行分層有三個(gè)主要理由:抽樣方法的效率較高; 能保證欲進(jìn)行分析的特定研究域有足夠的樣本量,以便進(jìn)行分析; 避免抽到一個(gè)“差的”樣本。第五十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月為充分利用分層抽樣的效率,層內(nèi)必須有高度的同質(zhì)性(即同一層內(nèi)的每一個(gè)單元的調(diào)查指標(biāo)應(yīng)是相近的),而不同層之間的差異應(yīng)盡可能大。第六十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 分層抽

26、樣的優(yōu)點(diǎn)有:能提高對(duì)總體估計(jì)值的精度;能保證樣本對(duì)被定義為層的那些子總體的代表性,從而得到有效的估計(jì);操作與管理方便;能避免得到一個(gè)“差的”樣本;在不同的層中可以使用不同的抽樣框和不同的抽樣方法。第六十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 分層抽樣的缺點(diǎn)有:要求抽樣框中的所有單元,都必須有能用于分層的輔助信息;調(diào)查框的創(chuàng)建較簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣需更多的費(fèi)用,也更為復(fù)雜。第六十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多階抽樣多階抽樣是用兩個(gè)或更多連續(xù)的階段抽取樣本的過(guò)程。第一階段抽取的單元稱(chēng)為初級(jí)或一級(jí)抽樣單元(PSU),第二階段抽取的單元稱(chēng)為次級(jí)或二級(jí)抽樣單元(SSU),以

27、此類(lèi)推。第六十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多階樣本(圖示)第六十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月常見(jiàn)的多階抽樣是二階抽樣:第一階抽樣用地域框抽地理小區(qū)(PSU);第二階用系統(tǒng)抽樣抽小區(qū)內(nèi)的住所(SSU)。在前面介紹的(一階)整群抽樣中,樣本群中的所有單元都入樣。在兩階抽樣中,從每個(gè)抽中的群(一級(jí))單元中再抽一部分(二級(jí))單元進(jìn)行調(diào)查。第六十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月多階抽樣常與地域框結(jié)合使用,作為解決整群抽樣效率低問(wèn)題的一種方法。多階抽樣中的階數(shù)越多,設(shè)計(jì)(及估計(jì))越復(fù)雜,通常我們只用二階或三階抽樣。第六十六張,PPT共一百零一頁(yè),創(chuàng)作于2

28、022年6月例:加拿大勞動(dòng)力調(diào)查(LFS)全國(guó)被劃分為1100多個(gè)層,每個(gè)層由一組普查小區(qū)(EA)組成。普查小區(qū)是由人口普查時(shí)所確定的地理區(qū)域,普查員能對(duì)它所覆蓋的區(qū)域進(jìn)行詳細(xì)清查。第一階抽樣是從每個(gè)層中抽取關(guān)于普查小區(qū)或普查小區(qū)組的分層樣本。在第二階抽樣中,將這些小區(qū)繪圖,列出它們中的所有住所,并從中按系統(tǒng)抽樣抽取住所。然后,調(diào)查抽中住所內(nèi)的所有人。第六十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多階抽樣的優(yōu)點(diǎn)有:當(dāng)群內(nèi)單元對(duì)于調(diào)查變量是同質(zhì)時(shí),多階抽樣比單階整群抽樣的效率高;樣本分布相對(duì)集中,因此采用面訪(fǎng)的旅行時(shí)間和費(fèi)用都大為降低;不需要有整個(gè)總體的名錄框,所要的只是在每個(gè)階段抽樣都

29、有一個(gè)完整的抽樣框。第六十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多階抽樣的缺點(diǎn)有:雖然多階抽樣的效率比一階整群抽樣的高,但它沒(méi)有簡(jiǎn)單隨機(jī)抽樣的效率高;通常不能提前知道多階抽樣的樣本量,因?yàn)樵诰唧w調(diào)查前,我們不知道在每個(gè)大單元中到底包含多少個(gè)下級(jí)單元(若固定每個(gè)大單元中的抽樣數(shù)目,則總的樣本量也可控制);調(diào)查的組織較為復(fù)雜(比單階整群抽樣復(fù)雜);估計(jì)值與抽樣方差的計(jì)算較為復(fù)雜。第六十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多相抽樣多相抽樣先抽一個(gè)有很多單元的大樣本,收集基本的信息,然后在這個(gè)大樣本中抽取一個(gè)子樣本,收集更詳細(xì)的信息。多相抽樣能用在抽樣框缺乏輔助信息,而又想對(duì)總體

30、進(jìn)行分層或篩選部分總體的情況。當(dāng)沒(méi)有充足的預(yù)算收集整個(gè)樣本的信息,或這樣做會(huì)導(dǎo)致額外的回答負(fù)擔(dān)時(shí),也可以用多相抽樣抽取子樣本的方法來(lái)收集更詳細(xì)的信息。第七十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多相樣本(圖示)第七十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月第一相是批發(fā)零售貿(mào)易月度調(diào)查。每個(gè)月,批發(fā)零售貿(mào)易月度調(diào)查要求批發(fā)零售基層單位提供兩個(gè)數(shù)據(jù):月度銷(xiāo)售額和庫(kù)存量。零售商品季度調(diào)查再?gòu)倪@些零售基層單位抽取一個(gè)子樣本,在調(diào)查時(shí)要求它們把銷(xiāo)售額分解到各類(lèi)商品,如服裝、電器、食品等。例:加拿大零售商品季度調(diào)查(QRCS)第七十二張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月多相抽樣可以用

31、于在一項(xiàng)調(diào)查中不同問(wèn)題的數(shù)據(jù)收集費(fèi)用差異很大的情形。第一相收集的數(shù)據(jù)除能用作分層及篩選信息外,還能用來(lái)提高估計(jì)的效率(例如用于比估計(jì)或回歸估計(jì))。第七十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多相抽樣的優(yōu)點(diǎn)是:能顯著提高估計(jì)值精度(與簡(jiǎn)單隨機(jī)抽樣相比);能用來(lái)獲得抽樣框中所沒(méi)有的輔助信息(特別是分層信息);適用于某些調(diào)查指標(biāo)的數(shù)據(jù)收集費(fèi)用特別高,或會(huì)給被調(diào)查者帶來(lái)較重的回答負(fù)擔(dān)的情況;第七十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 多相抽樣的缺點(diǎn)有:如果需要根據(jù)第一相的結(jié)果來(lái)進(jìn)行第二相調(diào)查,得到整個(gè)調(diào)查結(jié)果的時(shí)間比單相調(diào)查長(zhǎng);由于對(duì)某些樣本單元訪(fǎng)問(wèn)次數(shù)超過(guò)一次,故所需費(fèi)用比一相調(diào)

32、查要多;調(diào)查的組織會(huì)很復(fù)雜;估計(jì)值和抽樣誤差的計(jì)算會(huì)相當(dāng)復(fù)雜。第七十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 (三)抽樣設(shè)計(jì)的比較 如果要以樣本的結(jié)果為基礎(chǔ)對(duì)總體進(jìn)行推斷,則選用概率抽樣。 如果有目錄,或能以適當(dāng)?shù)耐度雱?chuàng)建總體各單元的一個(gè)目錄,則考慮用簡(jiǎn)單隨機(jī)抽樣。 如果數(shù)據(jù)使用者不管你使用什么樣的設(shè)計(jì),都認(rèn)為樣本是簡(jiǎn)單隨機(jī)樣本,則考慮用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣。第七十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 如果總體分布的地理距離很寬,且每個(gè)單元的數(shù)據(jù)收集費(fèi)用很高,則考慮使用多階段抽樣設(shè)計(jì)。 如果總體單元自然成群,或有總體單元分組目錄,或者打算使用地域抽樣框,則使用多階整群抽樣。

33、如果抽樣框有能用作分層或能用作規(guī)模度量等的輔助信息,且這些變量與主要調(diào)查變量相關(guān),則考慮用分層抽樣;第七十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月如果有準(zhǔn)確且與主要調(diào)查變量相關(guān)的規(guī)模度量,則考慮使用與大小成比例的概率抽樣;如果規(guī)模度量不準(zhǔn)確,則考慮按規(guī)模度量分組并按規(guī)模分層。 如果需要作域估計(jì)且這些域能在抽樣框中確定,則考慮將域作為層進(jìn)行分層抽樣。第七十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 如果抽樣框缺乏想用來(lái)分層或?qū)傮w進(jìn)行篩選的輔助信息,則考慮進(jìn)行多相抽樣,取一個(gè)較大的第一相樣本用來(lái)收集在第二相要使用的分層信息。 如果要收集的部分信息收集起來(lái)費(fèi)用較高,則考慮使用多相抽樣。第

34、七十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月影響調(diào)查樣本量大小的因素主要有兩個(gè):一是調(diào)查估計(jì)值所希望達(dá)到的精度,也就是調(diào)查估計(jì)值所能允許的誤差;二是調(diào)查實(shí)際操作的限制條件,如經(jīng)費(fèi)、時(shí)間等。樣本量的確定第八十張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月1影響精度的因素(1)總體的變異程度大;(2)總體的大小;(3)樣本設(shè)計(jì)方式和所用的估計(jì)量;(4)調(diào)查的回答率的高低。第八十一張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月總體大小 在樣本量確定過(guò)程中,總體所起的作用因它的大小而有所差異。對(duì)于小規(guī)模總體,它起著重要作用;對(duì)于中等規(guī)模的總體,其作用中等;而大總體對(duì)樣本量影響的作用很小。 第八十二張

35、,PPT共一百零一頁(yè),創(chuàng)作于2022年6月例如:用簡(jiǎn)單隨機(jī)抽樣估計(jì)P,要求在置信度為95%下誤差限為0.05所需的樣本量(p=0.05)總體大小N所需的樣本量n5044100805002221000286500037010000385100000398100000040010000000400第八十三張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 樣本設(shè)計(jì)和估計(jì)量 一般來(lái)說(shuō),當(dāng)樣本量采用簡(jiǎn)單隨機(jī)抽樣的計(jì)算公式,而實(shí)際使用的是更復(fù)雜的抽樣方式時(shí),為達(dá)到給定精度所需的樣本量,應(yīng)該在此基礎(chǔ)上乘以一個(gè)稱(chēng)為設(shè)計(jì)效應(yīng)因子。設(shè)計(jì)效應(yīng)是對(duì)于相等的樣本量,給定樣本設(shè)計(jì)估計(jì)量的抽樣方差對(duì)簡(jiǎn)單隨機(jī)抽樣估計(jì)量的抽樣方差

36、的比率。第八十四張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)等于1;分層抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)一般小于等于1;整群或多階抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)一般大于等于1。對(duì)于非概率抽樣,假設(shè)設(shè)計(jì)效應(yīng)等于2或3。 若過(guò)去相同或相似主題的調(diào)查所用的抽樣設(shè)計(jì)與我們計(jì)劃實(shí)施的抽樣設(shè)計(jì)相同或相似,就能得到當(dāng)前調(diào)查主要變量設(shè)計(jì)效應(yīng)的估計(jì)值。我們也可以從試調(diào)查中得到設(shè)計(jì)效應(yīng)的估計(jì)值。 設(shè)計(jì)效應(yīng)第八十五張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 調(diào)查的回答率需要根據(jù)預(yù)計(jì)的回答率調(diào)整樣本量的大小,根據(jù)預(yù)計(jì)的回答率確定一個(gè)較大的樣本才可能達(dá)到精度要求。 第八十六張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月樣本量的計(jì)算步驟1)對(duì)于簡(jiǎn)單隨機(jī)抽樣,對(duì)平均值估計(jì)的樣本量計(jì)算:第1步:計(jì)算初始樣本量 第八十七張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月第2步:對(duì)總體大小進(jìn)行調(diào)整:第3步:如果抽樣設(shè)計(jì)不是簡(jiǎn)單隨機(jī)抽樣,則用下面公式對(duì)樣本量進(jìn)行調(diào)整 : 其中,B是設(shè)計(jì)效應(yīng)。 第八十八張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月 第4步:根據(jù)無(wú)回答再次進(jìn)行調(diào)整,以確定最終的樣本量: 其中,r為預(yù)計(jì)的回答率。 第八十九張,PPT共一百零一頁(yè),創(chuàng)作于2022年6月對(duì)于簡(jiǎn)單隨機(jī)抽樣,對(duì)比例估計(jì)的樣本量的計(jì)算步驟:因?yàn)樵诒壤烙?jì)中,樣本的方差變?yōu)椋河谑堑谝徊?/p>

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論