第六章 多階段抽樣_第1頁
第六章 多階段抽樣_第2頁
第六章 多階段抽樣_第3頁
第六章 多階段抽樣_第4頁
第六章 多階段抽樣_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六章第六章 多階段抽樣多階段抽樣 Multi-Stage Sampling第六章第六章 多階段抽樣多階段抽樣 教學目的教學目的 通過本章的教學,使通過本章的教學,使學生了解多階段抽樣的學生了解多階段抽樣的定義和抽選方法與推斷定義和抽選方法與推斷原理;掌握初級單元大原理;掌握初級單元大小相等的二階抽樣和初小相等的二階抽樣和初級單元大小不等的二階級單元大小不等的二階抽樣方法;明確多階段抽樣方法;明確多階段抽樣的其他有關問題。抽樣的其他有關問題。 重點與難點重點與難點 本章的重點是初級單本章的重點是初級單元大小相等的二階抽元大小相等的二階抽樣和初級單元大小不樣和初級單元大小不等的二階抽樣方法。等的

2、二階抽樣方法。難點是初級單元大小難點是初級單元大小相等的二階抽樣和初相等的二階抽樣和初級單元大小不等的二級單元大小不等的二階抽樣方法。階抽樣方法。本章結構本章結構 6.1 引言引言 6.2 初級單元大小相等的二階抽初級單元大小相等的二階抽樣樣 6.3 初級單元大小不等的二階抽初級單元大小不等的二階抽樣樣 4. 6.4三階及多階抽樣三階及多階抽樣6.1 6.1 引言引言一、概念一、概念 在整群抽樣中,如果抽中的群內所含的次級單元個數相在整群抽樣中,如果抽中的群內所含的次級單元個數相當地多,此時對該群作普查會感到當地多,此時對該群作普查會感到“心有余而力不足心有余而力不足”。特。特別當群內的次級單

3、元差異不大,即別當群內的次級單元差異不大,即 比較大,這種情形下比較大,這種情形下對群內所有的次級單元一一訪問似乎完全沒有必要,一個省對群內所有的次級單元一一訪問似乎完全沒有必要,一個省時省錢又省力的念頭會在調查者的頭腦中油然而生,何不在時省錢又省力的念頭會在調查者的頭腦中油然而生,何不在抽到的群內再作一定方式的抽樣呢?這種在選中的初級單元抽到的群內再作一定方式的抽樣呢?這種在選中的初級單元中再進行抽樣的方法稱為中再進行抽樣的方法稱為二階抽樣二階抽樣。倘若在抽取的次級單元。倘若在抽取的次級單元中又包含許多更次一級的單元,在這些單元中繼續抽樣就自中又包含許多更次一級的單元,在這些單元中繼續抽樣就

4、自然地稱為然地稱為三階抽樣三階抽樣。c 二階抽樣與分層抽樣、整群抽樣的二階抽樣與分層抽樣、整群抽樣的一個共同特點是一個共同特點是:將:將總體分為若干個群;總體分為若干個群;所不同的是所不同的是:分層抽樣是每個群內都進:分層抽樣是每個群內都進行抽樣,整群抽樣是抽若干個群再在群內普查,而二階抽樣行抽樣,整群抽樣是抽若干個群再在群內普查,而二階抽樣則是抽若干個群再在群內抽樣。則是抽若干個群再在群內抽樣。因此,可將分層抽樣與整群因此,可將分層抽樣與整群抽樣看作是二階抽樣的特殊情況。抽樣看作是二階抽樣的特殊情況。抽樣形式抽樣形式第一階段第一階段第二階段第二階段分層抽樣分層抽樣整群抽樣整群抽樣二階抽樣二階

5、抽樣抽全部抽全部抽部分抽部分抽全部抽全部抽部分抽部分抽部分抽部分抽部分抽部分抽樣過程可以分為以下幾個步驟(以二階抽樣為例):抽樣過程可以分為以下幾個步驟(以二階抽樣為例):N總體總體R4R3R2R1R130一階單元一階單元R1R4R33R98R110抽取一階單元抽取一階單元n樣本樣本n1n2n3n4n5抽取二階單元抽取二階單元可以看出,二階抽樣在組織技術上是整群抽樣和分層抽樣的綜合可以看出,二階抽樣在組織技術上是整群抽樣和分層抽樣的綜合. 二、二階與多階抽樣的優點二、二階與多階抽樣的優點1、它具有實施上的方便,比如在編制抽樣框時、它具有實施上的方便,比如在編制抽樣框時那些沒有被抽到的群或次一級

6、群內的單元就沒有那些沒有被抽到的群或次一級群內的單元就沒有必要也去編制抽樣框。僅需對那些已抽中的單元必要也去編制抽樣框。僅需對那些已抽中的單元才去準備下一級單元的抽樣框,而且許多抽樣調才去準備下一級單元的抽樣框,而且許多抽樣調查常常采用行政系統及隸屬單元,這給多階抽樣查常常采用行政系統及隸屬單元,這給多階抽樣本身創造了有利的條件。本身創造了有利的條件。2、 能夠滿足各級政府部門對抽樣調查資料的需求。能夠滿足各級政府部門對抽樣調查資料的需求。 因為各級政府領導都關心全國和本地區、本因為各級政府領導都關心全國和本地區、本部門的社會經濟發展狀況,希望抽樣調查能同時部門的社會經濟發展狀況,希望抽樣調查

7、能同時滿足全國性和地方性的需要。因而采用二階或多滿足全國性和地方性的需要。因而采用二階或多階抽樣,在一定程度上能夠滿足各級政府、部門階抽樣,在一定程度上能夠滿足各級政府、部門對調查資料的需求。對調查資料的需求。3、有利于減少抽樣誤差、提高抽樣估計精度。、有利于減少抽樣誤差、提高抽樣估計精度。這種抽樣調查方法,可以使每個一階樣本單位這種抽樣調查方法,可以使每個一階樣本單位分布比較均勻,具有很好的代表性;對于方差分布比較均勻,具有很好的代表性;對于方差大的階段多抽些樣本單位以提高精度。大的階段多抽些樣本單位以提高精度。 另外,多階抽樣方法可以用到關于散料的抽另外,多階抽樣方法可以用到關于散料的抽樣

8、。所謂散料是指連續松散的不易區分為個體或樣。所謂散料是指連續松散的不易區分為個體或抽樣單元的材料。抽樣單元的材料。 例如,煤、糧食、水泥、化肥等原料的質量例如,煤、糧食、水泥、化肥等原料的質量檢測,此時抽樣單元常常需要人為劃分,一般取檢測,此時抽樣單元常常需要人為劃分,一般取自然單位,諸如一公斤、一杯子等;而初級單元自然單位,諸如一公斤、一杯子等;而初級單元則為包裝袋、一卡車、一個車皮等。這種數量眾則為包裝袋、一卡車、一個車皮等。這種數量眾多的散料的質量檢測采用二階或多階抽樣也許是多的散料的質量檢測采用二階或多階抽樣也許是最有效的手段最有效的手段. .為方便為方便, ,本章主要討論二階抽樣。本

9、章主要討論二階抽樣。6.2 6.2 初級單元大小相等的二階抽樣初級單元大小相等的二階抽樣 先作一些基本假設:先作一些基本假設: (1 1)初級單元中包含的次級單元個數同為初級單元中包含的次級單元個數同為M,因此在抽中的初級單元中再抽取的次級單元個數也因此在抽中的初級單元中再抽取的次級單元個數也相等,記為相等,記為 m (2 2)兩個階段的抽樣方法都是簡單隨機抽樣兩個階段的抽樣方法都是簡單隨機抽樣。 (3 3)在抽中的若干初級單元中作第二階抽樣是在抽中的若干初級單元中作第二階抽樣是相互獨立進行的相互獨立進行的。 再引進一些必要的記號:再引進一些必要的記號:ijY表示第表示第 初級單元中第初級單元

10、中第 個次級單元個次級單元1,2,;1,2,iNjM ijijy表示樣本中第表示樣本中第 初級單元中第初級單元中第 個次級單元的觀測值個次級單元的觀測值1,2, ;1,2,in jm ij1MiijjYY 第第 初級單元總和初級單元總和iiiYYM 第第 初級單元平均值初級單元平均值i11111NMNijiijiYYYNMN 總體平均值總體平均值222111()(1)NMijiijSYYN M 初級單元初級單元(群群)內的方差內的方差22111()1NiiSYYN 總體中初級單元總體中初級單元(群群)間方差間方差將將 改為改為 ,N改為改為n,M改為改為m,則為相應的樣本指標值則為相應的樣本指

11、標值Yy第第 i 群內次級單元間的方差記為:群內次級單元間的方差記為:22211()1MiijijSYYM 顯然有顯然有 所有所有 的平均數。的平均數。222211NiiSSN 22iS1、估計量及其方差、估計量及其方差 總體平均數總體平均數 的估計是用樣本平均數進行估計的的估計是用樣本平均數進行估計的Y11111nnmiijiijyyynnm 容易證明,這個估計量容易證明,這個估計量 是是 的無偏估計。的無偏估計。yY其方差為:其方差為:22121211( )ffVar ySSnnm(6.1)其中其中 ,1nfN 2mfM 方差的無偏估計為:方差的無偏估計為:22112121(1)( )ff

12、fv yssnnm (6.2)總體總數總體總數 的估計為:的估計為:Y yNM y 方差的無偏估計為:方差的無偏估計為:2( )()( )v yNMv y 總體平均數總體平均數95的置信區間為的置信區間為(1.96( ) ,1.96( )yv yyv y總體總數總體總數95的置信區間為的置信區間為(1.96( ) ,1.96( )yv yyv y i151ijjy 12345678910375.25408.30323.40502.50234.00387.75284.20256.60314.10280.501521ijjy 11280.2512115.998752.7617833.753953.

13、0011302.506573.044822.366921.015827.2525.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56iy22is例例6.1 新華書店某柜臺上月共用去發票新華書店某柜臺上月共用去發票70本,每本本,每本100張,張,現隨機從中抽出現隨機從中抽出10本,每本隨機抽出本,每本隨機抽出15張發票,得到數據張發票,得到數據如下表:給出上月柜臺營業總額的估計及其方差。如下表:給出上月柜臺營業總額的估計及其方差。解:解:N=70,

14、n=10,M=100,m=15101511111110 15nmijijijijyyynm 1375.25280.5022.44410 15 117f 20.15f 70 100 22.444157108yNM y 故上月柜臺營業總額的估計為故上月柜臺營業總額的估計為157108.00元元22111()29.761niisyyn 22221170.58niissn 22112121(1)( )2.61fffv yssnnm 標準差為標準差為 元元( )70 1002.6111308.85v y 營業總額營業總額95的置信區間為的置信區間為22( )()( )(70100)2.61v yNMv

15、y (1.96( ) ,1.96( )yv yyv y(134942.65 ,179273.35) 2、最優抽樣比、最優抽樣比 如果初級單元(或群)之間的旅行費用不占重要地位的如果初級單元(或群)之間的旅行費用不占重要地位的話,常采用簡單線性費用函數:話,常采用簡單線性費用函數: 二階抽樣存在兩次概率抽樣,因而存在兩個抽樣比二階抽樣存在兩次概率抽樣,因而存在兩個抽樣比 因此我們面臨的問題是:因此我們面臨的問題是:(1)在總費用給定的條件下,如何在總費用給定的條件下,如何確定確定 與與 而使而使 的方差達到最小;的方差達到最小;(2)在給定估計量的精在給定估計量的精度度 條件下,如何確定條件下,

16、如何確定 與與 以使總費用最小。以使總費用最小。y12,ff1f2f1f2f( )Var y0c12,cc其中其中 是基本費用,是基本費用, 是每調查一個初級單元與次級單元是每調查一個初級單元與次級單元所花費的費用。所花費的費用。012Ccc nc nm (6.3)將方差表達成:將方差表達成:222222111( )()SSSVar ySnMnmN(6.4) 于是,在固定于是,在固定C下極小化下極小化 或在固定或在固定 下極小化下極小化 C均等價于使下式極小化:均等價于使下式極小化:( )Var y( )Var y222201SSSM其中:其中: 。但這里要求。但這里要求 。2222010SS

17、SM2222010SSSM假如假如 ,表明群內差異明顯地大于群間的差異,表明群內差異明顯地大于群間的差異,因此對于抽到的群來說,最好作全面調查才能保證樣本的代因此對于抽到的群來說,最好作全面調查才能保證樣本的代表性,此時總使表性,此時總使mM。2222010SSSM現考慮現考慮222222101122220121( )()()()()()SSVar ySCcScc mNMmSScc mm(6.5)在在(6.5)式中,由于式中,由于 都是常數,為使都是常數,為使(6.5)達到最達到最小,只要小,只要220212,SSc c達到最小,這兩個加項的乘積恰好為常數達到最小,這兩個加項的乘積恰好為常數

18、,因此,因此只要這兩項相等就可使只要這兩項相等就可使Q達到最小,此時應取達到最小,此時應取220212S S c c1202cSSmc m 或者或者m的最優取值為:的最優取值為:2102optScmSc (6.7)一般地,一般地, 不是整數,記不是整數,記 為為 的最小整數部分,那的最小整數部分,那么么 ( 為為 的小數部分,且的小數部分,且 )。)。optmoptmoptmoptoptmmaoptma0a 222102S cQS c mm(6.6)2(12 )optaa m如果如果 ,則取,則取 1optmm如果如果 ,則取,則取2(12 )optaa moptmm 易見,對于易見,對于 的

19、小數部分大于或等于的小數部分大于或等于0.5的情況,我們總取的情況,我們總取 ,這符合通常的,這符合通常的“五入五入”規則,是否規則,是否“四舍四舍”?當當 時,就要看時,就要看 的最小整數部分的大小了。的最小整數部分的大小了。optm 1optmmoptm0.5a 由由 m 的選取,代入的選取,代入(6. .3)或或(6. .4)立即可以得到立即可以得到 n 的數值。的數值。3、分層二階抽樣、分層二階抽樣 所謂分層二階抽樣就是將總體分為所謂分層二階抽樣就是將總體分為 k 個層,在個層,在每層內進行二階抽樣。比如,一所大學有每層內進行二階抽樣。比如,一所大學有 8 個系,個系,每個系有若干個班

20、級,每班大約人數為每個系有若干個班級,每班大約人數為40人,為了人,為了解學生的情況需要作一次抽樣調查,在每個系都隨解學生的情況需要作一次抽樣調查,在每個系都隨機抽幾個班,再在抽中的班級里抽取若干人的簡單機抽幾個班,再在抽中的班級里抽取若干人的簡單隨機抽樣,這就構成二階分層抽樣。隨機抽樣,這就構成二階分層抽樣。 本節討論的二階分層抽樣,假設在同一層內初級單元大本節討論的二階分層抽樣,假設在同一層內初級單元大小相等,但不同層可以不相等。設第小相等,但不同層可以不相等。設第 h 層含層含 個初級單元,個初級單元,每個初級單元包含每個初級單元包含 個次級單元,于是總體中共含有個次級單元,于是總體中共

21、含有個次級單元。又假設在第個次級單元。又假設在第 h 層按照簡單隨機抽樣方法抽取層按照簡單隨機抽樣方法抽取個初級單元,在每個被抽中的初級單元中再抽取容量為個初級單元,在每個被抽中的初級單元中再抽取容量為 的的簡單隨機抽樣。簡單隨機抽樣。hNhM1khhhN M hnhmhy 設第設第 h 層中樣本的層中樣本的(二階抽樣二階抽樣)平均數為平均數為 ,因此按照分,因此按照分層估計的技巧,總體的層估計的技巧,總體的(按次級單元按次級單元)平均數平均數 的分層二階估的分層二階估計量為:計量為:Y111khhhkhsthhkhhhhN M yyW yN M (6.8)其中其中 為第為第 h 層層(按次級

22、單元按次級單元)的層權:的層權:hW1hhhkhhhN MWN M (6.9)(6.10)而而11hhnmhijijhhhyyn m 由于各層的抽樣相互獨立,而由二階抽樣的有關討論,由于各層的抽樣相互獨立,而由二階抽樣的有關討論, 的的方差及其方差估計是已知的,因此:方差及其方差估計是已知的,因此:hy2221212111()()khhsthhhhhhhffVar yWSSnn m (6.11)2221121211(1)()()khhhsthhhhhhhfffv yWssnn m (6.12)其中其中 分別為第分別為第 h 層中的兩個抽樣比。層中的兩個抽樣比。12hhhhhhnmffNM、 和

23、和 是第是第 h 層中的群間和群內方差,層中的群間和群內方差, 與與 是第是第 h 層中樣本的群間和群內方差。層中樣本的群間和群內方差。21hS22hS21hs22hs顯然,總體總和的分層二階抽樣估計為:顯然,總體總和的分層二階抽樣估計為:1ksthhhhyN M y (6.13)其方差及其方差估計為:其方差及其方差估計為:22221212111()()khhsthhhhhhhhffVar yN MSSnn m 22221121211(1)()()khhhsthhhhhhhhfffv yN Mssnn m 在分層二階抽樣中當然也存在最優抽樣比的問題,不過此在分層二階抽樣中當然也存在最優抽樣比的

24、問題,不過此時假定費用函數一般應當與時假定費用函數一般應當與“層層”有關系:有關系:0112211kkhhhhhhhCcc ncn m (6.14)固定費用固定費用C而使方差達到最小或方差有一定精度要求下使而使方差達到最小或方差有一定精度要求下使費用達到最小,此時費用達到最小,此時 的最優選擇為:的最優選擇為:hm2122212hhhhhhhScmcSSM (6.15)其中總假設對所有的其中總假設對所有的 h ,都有都有 。22120hhhSSM6.3 6.3 初級單元大小不等的二階抽樣初級單元大小不等的二階抽樣 在實踐中,除少數情況外,初級單元的大小不在實踐中,除少數情況外,初級單元的大小不

25、一定相等當然理想一些的情況,我們在分群時就注一定相等當然理想一些的情況,我們在分群時就注意到先將單元按照大小分層,使得同一層中初級單意到先將單元按照大小分層,使得同一層中初級單元大小相等,然后利用上面所講的分層二階抽樣的元大小相等,然后利用上面所講的分層二階抽樣的辦法來做。只可惜在實際操作中,分層分群常常有辦法來做。只可惜在實際操作中,分層分群常常有一些一些“自然自然”形式,例如從行政系統劃分等。因此形式,例如從行政系統劃分等。因此,我們只能面對初級單元大小不等的情形,由于初,我們只能面對初級單元大小不等的情形,由于初級單元大小不一樣,合理的手段是對初級單元采用級單元大小不一樣,合理的手段是對

26、初級單元采用不等概率抽樣。不等概率抽樣。 先給出一些相關的記號:先給出一些相關的記號:ijY表示第表示第 初級單元中第初級單元中第 個次級單元個次級單元1,2,;1,2,iiN jM ij1iMiijjYY 第第 初級單元總和初級單元總和iiiiYYM 第第 初級單元平均值初級單元平均值i111iMNNiijiijYYY 總體總和總體總和01NiiMM 0YY M 總體平均數總體平均數(按次級單元按次級單元)22211()1iMiijijiSYYM 第第 i 初級單元內方差初級單元內方差1、只抽取一個初級單元情形(只抽取一個初級單元情形(n=1) 先考慮從先考慮從 N N 個初級單元中隨機選取

27、個初級單元中隨機選取 1 1 個以個以推斷總體。這種情形看起來似乎很特殊,但在生推斷總體。這種情形看起來似乎很特殊,但在生活中也不少見,例如在隨機地選的一個班級中抽活中也不少見,例如在隨機地選的一個班級中抽取幾個人進行考試以測試全年級的教育質量。只取幾個人進行考試以測試全年級的教育質量。只選取選取 1 1 個單元,仍有等概率與不等概率之分。個單元,仍有等概率與不等概率之分。(1)等概率抽取初級單元等概率抽取初級單元 考慮對總體平均數考慮對總體平均數 的估計的估計Y首先使用抽中的初級單元中的樣本平均數首先使用抽中的初級單元中的樣本平均數 對對 進行估計進行估計IyY11imIiijjiyyym

28、(6.16)對第對第 i 初級單元來講初級單元來講,由盒子模型可知,由盒子模型可知, 是是 的無偏估計。的無偏估計。由于第由于第 i 個抽樣單元是等概率抽取,相當于從盒子個抽樣單元是等概率抽取,相當于從盒子中等可能抽取一次,那么所得之數一定是這個盒子平均數的中等可能抽取一次,那么所得之數一定是這個盒子平均數的無偏估計,即無偏估計,即iyiY1(,)NYY11()NIiiE yYYN 而而 ,那么,那么 不是不是 的無偏估計,而是有偏估計!的無偏估計,而是有偏估計!YY YIy因此,對因此,對 只能求均方誤差:只能求均方誤差:Y作為作為 的有偏估計,的有偏估計, 的均方誤差由三部分構成:一是由偏

29、的均方誤差由三部分構成:一是由偏倚引起的平方和,這就是倚引起的平方和,這就是(6.17)式右邊的第一項;二是按初級式右邊的第一項;二是按初級單元單元(此時初級單元的特征指標當然只能是其平均數此時初級單元的特征指標當然只能是其平均數)而計算的而計算的總體方差,總體方差, (6.17)式右邊的第二項恰好體現出這一點;最后一式右邊的第二項恰好體現出這一點;最后一部分是初級單元中次級單元的方差平方和,這恰好是部分是初級單元中次級單元的方差平方和,這恰好是(6.17)式式右邊的第三項。右邊的第三項。YIy 從從 的表達式可以看出,其第一項和第二項都與的表達式可以看出,其第一項和第二項都與 的選擇沒有任何

30、關系,倘若要盡力減少誤差,目標自然注意的選擇沒有任何關系,倘若要盡力減少誤差,目標自然注意到第三項,然而第三部分是無法知道且也是無法估計的,因為到第三項,然而第三部分是無法知道且也是無法估計的,因為既然我們只選取一個初級單元,又如何能估計所有的既然我們只選取一個初級單元,又如何能估計所有的 呢?呢?()IMSE y22iSim22221111()()()NNiiIiiiiiiMmMSE yYYYYSNNM m (6.17) 由于是二階抽樣,也不可能取由于是二階抽樣,也不可能取 。在一般情況下,。在一般情況下,為了方便起見,常采用選取為了方便起見,常采用選取 常數,不管取到哪常數,不管取到哪一個

31、初級單元,總抽預先指定好的樣本容量,要不,取一個初級單元,總抽預先指定好的樣本容量,要不,取 與與 成一定的比例比較合理一些。成一定的比例比較合理一些。iimM imm imiMIy 不是不是 的無偏估計這一缺陷是由的無偏估計這一缺陷是由“等可能等可能”抽取而引抽取而引起的,這時候每一個起的,這時候每一個 有著同等重要的地位有著同等重要的地位而由于初級單元大小不同,在而由于初級單元大小不同,在 的構造中顯然的構造中顯然 不是有著不是有著同等地位的,這個事實使我們找到了一個彌補同等地位的,這個事實使我們找到了一個彌補“等可能等可能”所引所引起缺陷的辦法,那就是在構造估計量時考慮被抽到的初級單起缺

32、陷的辦法,那就是在構造估計量時考慮被抽到的初級單元的大小作為元的大小作為“權權”:Y(1,2,)iY iN YiY0IIiiiiMN MyyyMM (6.18)其中其中 表示所有初級單元的平均大小。這個估計的表示所有初級單元的平均大小。這個估計的意義很清楚,它的意義很清楚,它的 乘以乘以 成為第成為第 i 個初級單元內總和的個初級單元內總和的估計,再乘以估計,再乘以 N 成為總體總和的估計,這個估計除以成為總體總和的估計,這個估計除以 作作為為 的估計量是合理的。的估計量是合理的。0MM N iMiy0MY“權權” 的作用是使初級單元的指標化為次級單元的有關的作用是使初級單元的指標化為次級單元

33、的有關指標。既然指標。既然 是第是第 i 個初級單元的總和的無偏估計,由于個初級單元的總和的無偏估計,由于第一階抽樣的第一階抽樣的“等可能性等可能性”, 應當是總體總和的無偏估應當是總體總和的無偏估計,于是有:計,于是有: iMMiiM yiiNM y()IIEyY (6.19)222211()11()IINNiiiiiiiiiMM MmVar yYYSNMNMm (6.20)IIy的方差為:的方差為: 應當指出,應當指出, 對對 彌補的只是彌補的只是“期望期望”或或“平均平均”上的偏上的偏倚,至于在精度上是否獲益則很難定。例如,倘若各個初級倚,至于在精度上是否獲益則很難定。例如,倘若各個初級

34、單元的平均數單元的平均數 比較穩定,而比較穩定,而 相距較大,引起相距較大,引起 前的系前的系數數 的差異較大,這種場合下的差異較大,這種場合下 比起比起 來變化范圍來變化范圍顯然大得多,效果就比較差。顯然大得多,效果就比較差。IIyIyiYiMiyiMMIIyIy(2)不等概率抽取初級單元不等概率抽取初級單元 用等概率方法抽取初級單元對于大小不等的初級單元情用等概率方法抽取初級單元對于大小不等的初級單元情形顯然不太合理,精度較差是可想而知的。一般地,我們采形顯然不太合理,精度較差是可想而知的。一般地,我們采用的不等概率抽取法有如下幾種:用的不等概率抽取法有如下幾種: 按概率按概率 抽取到第抽

35、取到第 i 個初級單元,此時構造的估計個初級單元,此時構造的估計量為:量為:0iMMIIIiyy (6.21)IIIyIy 與與 表面上形式相同,只不過表面上形式相同,只不過 取取 的概率為的概率為Iyiy1N而而 取取 的概率為的概率為IIIyiy0iMM111001()iMNNiIIIiijiijME yyYYMM (6.22)IIIy即即 是是 的無偏估計量。的無偏估計量。Y222110011()()()NNiiIIIiiiiiiMMVar yYYSMMmM 222110()1()NNiiiiiiiiMmM YYSMm (6.23)抽取概率抽取概率按預先指定的一組概率按預先指定的一組概率

36、 來實施,來實施,構造估計量為:構造估計量為:1,1NiiiZZ 0iiIViMyyMz(6.24)1100()NNiiiIViiiiiMYME yZYYMZM (6.25)IVy即即 是是 的無偏估計量。的無偏估計量。Y2222221100111()()()NNiiiIViiiiiiiiiM YMVar yZYZSM ZMZmM 220221101()NNiiiiiiiiiiiiM YMMmZM YSMZZm (6.26)顯然,若取顯然,若取 ,則,則 。若取若取 ,則,則 。0iiZMM IVIIIyy 1iZN IVIIyy 抽取方式與抽取方式與相同,但構造的關于相同,但構造的關于 的估

37、計量為:的估計量為:YViyy (6.27)此時,每個此時,每個 具有權具有權 ,因此,因此iYiZ1()NViiZiE yZ YY (6.28)一般地一般地 ,因此,因此 是有偏估計。其均方誤差為:是有偏估計。其均方誤差為:ZYY Vy222211()()()()NNiiiVZiiZiiiiiZ MmMSE yYYZ YYSM m (6.29)2、抽取、抽取 個初級單元情形個初級單元情形1n 兩個以上的初級單元里進行第二階抽樣,合理的基本假兩個以上的初級單元里進行第二階抽樣,合理的基本假定是在不同的初級單元內的抽樣過程相互之間獨立。為方便定是在不同的初級單元內的抽樣過程相互之間獨立。為方便起

38、見,仍像以前一樣假定第二階抽樣為簡單隨機抽樣,在這起見,仍像以前一樣假定第二階抽樣為簡單隨機抽樣,在這一小段討論中,我們主要考慮總體總和的估計。一小段討論中,我們主要考慮總體總和的估計。(1)初級單元按多項抽樣方法抽取)初級單元按多項抽樣方法抽取 設初級單元以給定的一組概率設初級單元以給定的一組概率 逐個放回地逐個放回地1(,1)NiiiZZ imim抽取抽取 n 次,在每個被抽中的初級單元里實施容量為次,在每個被抽中的初級單元里實施容量為 的簡的簡單隨機抽樣:假若第單隨機抽樣:假若第 i 個初級單元在第一階抽樣中被抽中二個初級單元在第一階抽樣中被抽中二次或二次以上,那么在第次或二次以上,那么

39、在第 i 個初級單元中將獨立地對全體次個初級單元中將獨立地對全體次級單元進行二次或二次以上的容量為級單元進行二次或二次以上的容量為 的簡單隨機抽樣。的簡單隨機抽樣。 顯然,對第顯然,對第 i 個初級單元的總和個初級單元的總和 可自然地找到無偏估可自然地找到無偏估計計 ,以這些,以這些 代替代替 的話,那么整群抽樣中的的話,那么整群抽樣中的HansenHurwitz型估計無疑為型估計無疑為 提供了無偏估計:提供了無偏估計:iYiYYiy iiiyM y 1111nniiiHHiiiiyM yynznz (6.30)其方差為:其方差為:2222211(1)11()NNiiiHHiiiiiiiYMf

40、Var yZYSnZnm Z (6.31)其中其中2(1,2,)iiimfiNM(2)初級單元按簡單隨機抽取方式抽取)初級單元按簡單隨機抽取方式抽取 由于二階抽樣都是采用簡單隨機抽樣形式,于是可對由于二階抽樣都是采用簡單隨機抽樣形式,于是可對總體總和采用一個最為簡單的估計形式:總體總和采用一個最為簡單的估計形式:11nnuiiiiiNNyM yynn(6.32)由于由于 與與 是是 與與 的無偏估計,因此的無偏估計,因此 也是也是 的的無偏估計。無偏估計。iyiy iYiYYuy 其方差為:其方差為: 2212221111()111NuiiNiiiiiVar yNYYnNNNMSnmM (6.

41、33)方差方差 的無偏估計為:的無偏估計為:()uVar y 2212221111()111Nuiuiniiiiiv yNyynNnNMsnmM (6.34)其中其中11nuiiyyn 22211()1imiijijisyym 這類簡單估計雖然形式簡單,而且結構也容易為人們接這類簡單估計雖然形式簡單,而且結構也容易為人們接受,同時又是總體的無偏估計,但是它的效果并不理想,方受,同時又是總體的無偏估計,但是它的效果并不理想,方差顯得較大。差顯得較大。(3)按不放回不等概率抽取初級單元)按不放回不等概率抽取初級單元 如果抽取到的第如果抽取到的第 i 個初級單元的總和估計為個初級單元的總和估計為 (

42、簡單簡單隨機抽樣下的無偏估計隨機抽樣下的無偏估計),那么由第六章第二節易知,總體,那么由第六章第二節易知,總體總和的二階估計可采用如下形式的總和的二階估計可采用如下形式的HorvitzThompson估計估計量。量。iiM y 現在考慮初級單元是按不放回不等概率抽取,而第二階現在考慮初級單元是按不放回不等概率抽取,而第二階抽取仍為在抽取的初級單元中實行簡單隨機抽樣。那么在第抽取仍為在抽取的初級單元中實行簡單隨機抽樣。那么在第一階抽樣中就存在包含概率一階抽樣中就存在包含概率 。,iij 11nniiiHTiiiiM yyy(6.35)由于由于 或或 是是 的無偏估計,又的無偏估計,又 是是 的無

43、偏估的無偏估計,所以計,所以 是是 的無偏估計。的無偏估計。iiM yiy iYY1niiiy YHTy 其方差為:其方差為:22211()()NNNjiiHTijijij iiijiYYVar y (6.36)其中其中 222211111iMiiijijiiiMYYnMM 方差方差 的無偏估計為:的無偏估計為:()HTVar y 22211()()nnNjiiHTijijij iiijiyyv y (6.37)其中其中 222211111iniiijijiiiMyynMn 6.4 6.4 三階及多階抽樣三階及多階抽樣 將有關二階抽樣的一些公式與估計推廣到三階乃至更高將有關二階抽樣的一些公式與

44、估計推廣到三階乃至更高階的情況是很現實的,其實基本上是依樣畫葫蘆,只不過在階的情況是很現實的,其實基本上是依樣畫葫蘆,只不過在符號與計算方面更為復雜些,尤其是對于各級單元大小都相符號與計算方面更為復雜些,尤其是對于各級單元大小都相等時更是如此,下面以三階為例。等時更是如此,下面以三階為例。1、各級單元大小均相等時的三階抽樣、各級單元大小均相等時的三階抽樣 設總體中含有設總體中含有N個初級單元,每個初級單元包含個初級單元,每個初級單元包含M個次個次級單元,而每一個次級單元均包含級單元,而每一個次級單元均包含K個三級單元。各階的抽個三級單元。各階的抽樣容量分別為樣容量分別為 n、m、k,引進一些必要的記號:,引進一些必要的記號:ijtY表示第表示第 初級單元中第初級單元中第 個次級單元里第個次級單元里第 個三級單元個三級

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論