系統抽樣09970_第1頁
系統抽樣09970_第2頁
系統抽樣09970_第3頁
系統抽樣09970_第4頁
系統抽樣09970_第5頁
已閱讀5頁,還剩85頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 系統抽樣n第一節 概述n第二節 等概率系統抽樣估計量n第三節 不同特征總體的系統抽樣n第四節 系統抽樣的方差估計第一節 概述n一、系統抽樣的定義n二、系統抽樣的實施方法n三、排序標志n四、系統抽樣的特點n五、系統抽樣、整群抽樣與分層抽樣的關系一、系統抽樣的定義n系統抽樣(Systematic sampling):也稱機械抽樣,它是將總體中的單元按某種順序排列,在規定的范圍內隨機抽取起始單元,然后按一套規則確定其它樣本單元的一種抽樣方法。n上述定義是廣義的,事實上,總體單元的排列可以是一維的(直線或圓形的),也可以是二維的(平面的);起始單元可以是一個,也可以是一組;對總體單元的抽取可以

2、是等概的也可以是不等概的。n系統抽樣中最簡單的是等間隔抽取,這種系統抽樣又稱為等距抽樣等距抽樣。n等距抽樣的隨機性是有限制的,因此也被稱為偽隨機抽樣,但要注意:等距抽樣并未真正喪失隨機性原則。n例:工業產品質量檢查,每隔2小時抽選一個或若干樣品進行檢驗。二、系統抽樣的實施方法n(一)直線等距抽樣n假設:總體N個單元按直線排列,樣本容量為n, 且有N/n=k,k為整數,稱為抽樣間距整數,稱為抽樣間距(sampling interval)。n實施方法:n1.將總體分為n段,每段k個單元n2.在第一段的k個單元中隨機抽取一個單元rn3.每隔k個單元抽出一個單元,共抽取n個單元,則被抽中的單元編號分別

3、為: r, r+k, r+2k, r+(n-1)kn例見課本P142n方法評價:n當N/n=k為整數時,總體中每個單元的入樣概率都相等(都等于1/k),從而是一種嚴格的等概率抽樣。n當N/n=k不是整數時,實際抽取到的樣本單元數可能是N/k,也可能是N/k+1,也即與原來設定的樣本量可能相差1。每個單元的入樣概率也是不相等的。這時等距抽樣有可能產生偏倚。n(二)循環等距抽樣n為克服直線等距抽樣的上述缺陷,拉希里(Lahiri)提出一種替代方法,稱為循環(或圓形)等距抽樣。n實施方法:n1.將總體排成首尾相連的圓形。n2.在1N范圍內隨機抽取整數r作為起始單元編號。n3.每隔間距k(k為最接近N

4、/n的整數)抽取樣本單元。直到抽足n個單元為止。n評價:對于循環等距抽樣,即使對于N/n不為整數的情況,不僅樣本量不會隨起始值而變化,且是嚴格等概率的。n例:見P143n注意注意:以下為了處理方便,我們假定N總是n的整數倍。在實際工作中,若n充分大,則由于N/n非整數而帶來的影響就充分小,可以忽略不計。 n(三)不等概系統抽樣法n常用的不等概率系統抽樣是PS系統抽樣n令: 表示總體所有單元大小的總和,n則有入樣概率為:n在實際中,實施不等概率抽樣最簡單的方法是代碼法。NiiMM100MMniin實施方法:n1.先將單元 Mi值累加,取最接近M0/n 的整數k為抽樣間距。n2.從 1,k中隨機抽

5、取一個整數作為起始單元編號。n3.每間隔k抽取樣本單元,則代碼 r, r+k, ,r+(n-1)k 所對應的單元即樣本單元.n【例【例7.17.1】設總體由】設總體由1010個行政村組成個行政村組成, ,N=10,N=10,每個行政村的人每個行政村的人數數 M Mi i見下表見下表, ,利用利用PS 系統抽樣抽取系統抽樣抽取 n = 3 n = 3 個行政村個行政村行政村編號行政村編號人數人數(Mi)累計人數累計人數抽中代碼抽中代碼1103103100243253539663142468777235849616731034720512398168140713469146155310317187

6、0解:623,3,1870010nMknMMNii在 1,623中隨機抽取整數r,設r=100,則 r+k=723, r+2k=1346,則對應的行政村為1,4,8.注: 對于特別大的單元一般直接作為樣本,然后對剩余的單元組成的總體實施抽樣.三、排序標志n等距抽樣需要有作為排序依據的輔助標志。n排序標志各式各樣,可自由選擇,但歸納起來,可分為兩類,即無關標志和有關標志,它們對等距抽樣的作用和相應的估計精度各有不同的影響。 (一)按無關標志排隊 (無序系統抽樣)n即各單元的排列順序與所研究的內容無關.n如研究人口的收入狀況時,按身份證號碼、按門牌號碼排序非常方便,一般說來,這些號碼與調查項目沒有

7、關系,因此可以認為總體單元的次序排列是隨機的n無關標志排序的等距抽樣也稱無序等距抽樣。n評價:n在無關標志排序的條件下,各單元的位次排定,并不等于各單元的調查標志值也按同一次序排定,雖然是等距抽樣,它與隨機抽樣在性質上并無不同.n故無關標志排序的等距抽樣,實質上相同于簡單隨機抽樣,二者只是抽樣形式不同而已,完全無損于隨機原則,它們在估計精度上也是一致的。 (二)按有關標志排序 n即各單元的排列順序與所研究的內容是有關的, 用來對總體單元規定排列次序的輔助標志,與調查標志具有共同性質或密切關系。n這種排序標志,在我國抽樣調查實踐中有廣泛應用,如農產量調查,以本年平均畝產為調查變量,以往年已知平均

8、畝產作為排序標志。n利用這些輔助標志排序,有利于提高等距抽樣的抽樣效果。(三)根據各單元原有的自然位置進行排序n例如:學生按學號抽樣,入戶調查根據街道門牌號按一定間隔抽取等。n這種自然狀態的排列有時與調查標志有一定的聯系,但又不完完一致,這主要是為了抽樣方便。四、系統抽樣的特點n優點:n1.簡便易行,容易確定樣本單元n等距抽樣簡單明了,快速經濟,操作靈活方便,使用面廣,是單階段抽樣中變化最多的一種抽樣技術。n在某些場合下甚至可以不用抽樣框。例如若要對公路旁的樹木進行病蟲害調查,確定每20棵數檢查一棵,只要在初始被檢樹確定后,每隔20棵檢查一棵即行,根本不需要在事先對公路旁的所有樹木進行編號,或

9、者不需要知道抽樣框即所有樹木的棵數。n在我國,等距抽樣已成了最主要、最基本的抽樣方式,一些大規模的抽樣調查,如農產量抽樣調查、城鄉住戶調查、人口抽樣調查、產品質量抽樣檢查中都普遍采用了等距抽樣。n2.樣本單元在總體中分布比較均勻樣本單元在總體中分布比較均勻,有有 利于提利于提高估計精度高估計精度.n將總體各單元按一定的順序排列后再抽樣,使得樣本單元的分布更加均勻,因而樣本也就更具代表性,比簡單隨機抽樣更精確 。n缺點:n1.如果單元 的排列存在周期性的變化,而抽樣者對此缺乏了解或缺乏處理的經驗,抽取出樣本的代表性就可能很差可能很高。這時要慎重地選擇K。n如:調查某航空公司每月班機旅客人數(淡季

10、、旺如:調查某航空公司每月班機旅客人數(淡季、旺季)季)k=12n2.系統抽樣的方差估計較復雜,一般系統抽樣沒有設計意義下的無偏估計量,并且在很多實際應用中所采用的系統抽樣都不是嚴格的概率抽樣,這就給系統抽樣方差的估計帶來很大的困難.五、系統抽樣、整群抽樣和分層系統抽樣、整群抽樣和分層抽樣的關系抽樣的關系n系統抽樣可以看成是一種特殊的整群抽樣,也可以看成是一種分層抽樣。 n為了看清其中的關系,我們以一般的等距抽樣為例,將總體中的N(=nk)個單元按k個一組排成表,共有k行n列。n等距抽樣,即將總體個單元排列成k行n 列的矩陣,在從k之間隨機地產生一個隨機數r,則取第r行的全體單元作為樣本 系統

11、抽樣的總體單元系統抽樣的總體單元12jn平均1Y1Yk+1Y(j-1)k+1 Y(n-1)k+12Y2Yk+2Y(j-1)k+2 Y(n-1)k+2rYrYk+rY(j-1)k+rY(n-1)k+rkYkY2kYjkYnk1y2yrykyn如果將表的行看作群,實際上相當于將總體劃分為 k群,系統抽樣相當于從這 k個群中隨機地抽出一個大小為n的群實行整群抽樣,這是最簡單的整群抽樣.n因此,在討論傳統抽樣的參數估計時,很多場合將引用整群抽樣的一些現成結果.系統抽樣與整群抽樣參數的對照n如果將表的列看作層,那么系統抽樣又是一種分層抽樣:在每層中抽取一個單元,不過這個單元在每個層中的位置是相同的,因此

12、不是分層隨機抽樣. 系統抽樣的總體單元按行列重新編號12jn群平均1Y11Y12Y1jY1n2Y21Y22Y2jY2n:rYr1Yr2YrjYrn:KYk1Yk2YkjYkn層平均1Y2YjYnyYkYrY2Y1Y第二節第二節 等概率系統抽樣估計量等概率系統抽樣估計量n一、符號說明n二、估計量n三、估計量方差的不同表示形式一、符號說明 第r行第j列的單元指標值:Yrj Yrj=Y(j-1)k+r ,r=1,2,k; j=1,2,n 總體單元數:N 樣本單元數: n 系統樣本平均數: 系統樣本均值估計量:njrjryny11syy 層均值: , j=1,2,n 總體方差: 系統樣本(群)內方差:

13、 jy2S2112)() 1(1krnjrrjwsyyynkS2)()(YyEYyYyErjrurjwsy樣本(群)內相關系數:層內方差:211.2)() 1(1njkrjrjwstyyknS同一系統樣本內對層均值離差的相關系數:2.)()(jrjurujrjwstyyEyyyyE二、估計量設起始值為r,則相應系統樣本的平均數為:總體均值 的估計量為:njrjnjrjrYnyny1111Ynjrjrsyynyy11性質性質1 當當 N=nk 時時,有有 k 個可能樣本個可能樣本: 是無偏估計量是無偏估計量. 當當 , 采用直線等距方法時采用直線等距方法時, 是有偏的是有偏的.但但 N和和n均比

14、較大時均比較大時,其偏倚不會很其偏倚不會很大大,可以忽略不計可以忽略不計.若采用循環等距抽樣若采用循環等距抽樣, 是無偏的是無偏的.syyYynkykyEkrnjrjkrrsy11111)(nkN syysyy三、估計量方差的不同表示形式三、估計量方差的不同表示形式n如前所述,如果總體單元是按無關標志排列的,則其方差可按簡單隨機抽樣去做。n若總體單元是按有關標志排列的,則此時的等距抽樣可以看作是整群抽樣或分層抽樣的特例,因此,等距抽樣估計量的方差可以比照整群抽樣或分層抽樣的方法構造,有幾種表示方法。krrsysyYykYyEyV122)(1)()(為方便起見,假定 N= nk,因此系統樣本的平

15、均數 是總體均值的無偏估計,它的方差按定義為:syy性質性質2 用樣本用樣本(群群)內方差內方差 表示系統抽表示系統抽樣估計量的方差樣估計量的方差:2wsyS22) 1() 1()(wsysySNnkSNNyV2112)(11krnjrjYyNS式中:為總體方差。2112)() 1(1krnjrrjwsyyynkS為系統樣本(群)內方差Ysrsy221)(SnfSNnnNyVsrs如果從總體中直接抽取樣本量為n的簡單隨機樣本,則總體均值 的估計量 的方差為:)(1)()(22SSnnyVyVwsysysrs比較等距抽樣方差和簡單隨機抽樣方差:抽樣法抽樣效果相同系統抽樣法與簡單隨機等于總體方差時

16、,時,即等距樣本內方差當抽樣法;簡單隨機抽樣優于系統總體方差時,即等距樣本內方差小于當機抽樣;系統抽樣法優于簡單隨總體方差時,即等距樣本內方差大于當222222,SSSSSSwsywsywsy可見:性質3系統抽樣可看做一種特殊的整群抽樣,系統抽樣估計量的方差可以用群內相關系數 表示:wsysynNNnSyV) 1(1)1()(2)( )() 1)(1(2)()(122YyYySNnYyEYyYyErukrnujrjrjrurjwsywsy式中:可見:系統樣本(群)內正相關正相關越大,也即系統樣本內單元越相似,差別越小,則估計量的方差越大,這個結論與上面結論一致。 性質4系統抽樣可看做一種特殊的

17、分層抽樣,系統抽樣的估計量的方差可以用層內方差 和同一等距樣本內單元對層均值的相關系數 表示:wstSwstwstsynNnNnSyV) 1(1)()(2wst式中:211.2)() 1(1njkrjrjwstyyknS為層內方差)(2NnNnSwst恰為比例分配分層隨機抽樣的方差kiijjyky1.1為第j層的平均值2.)()(jrjurujrjwstyyEyyyyE為同一系統樣本內對層均值離差的相關系數.)( )() 1)(1(2.1.2urukrnujjrjwstyyyySknn比較系統抽樣方差 和比例分配的分層隨機抽樣方差 ,)(syyV)(styVwststsywststnyVyVN

18、nNnSyV)1(1)()()()(2于分層隨機抽樣。時,系統抽樣的精度高當同;單位的分層隨機抽樣相各層隨機抽取一個時,系統抽樣的精度與于分層隨機抽樣;時,系統抽樣的精度低當000wstwstwst可見:【例【例7.27.2】n設某個總體N=32個單元,總體單元排列顯然有穩定上升的趨勢.我們要產生一個樣本量為4的等距樣本,將總體單元排列如下表,k=8,n=4,每一列都是一個等距樣本,共8個等距樣本.n N=32,k=8,n=4等距樣本數據層 等距樣本編號層均值123456781113345673.7527881112 14 16 1611.5317 18202024 24 25 27 21.8

19、75427 28303134 34 36 3832.25總數52 55616574 77 83 88_顯然,層內具有正相關,由性質4可知,系統抽樣的精度低于分層隨機抽樣。n層內方差與總方差分別為:5 .11)()1(1211.2njkrjrjwstyyknS523.129)(111122krnjrjYyNS452. 9)(1)()(122krrsysyYykYyEyV516. 23243245 .11)()(2NnNnSyVwstst333.2845232.12932432)(2SNnnNyVsrs因此:本例中,分層隨機抽樣和等距抽樣比簡單隨機抽樣更有效,而分層隨機抽樣比等距抽樣更有效。實際上

20、,將總體單元按大小順序排列的目的就是為了增大系統樣本內方差,從而必然提高精度。 【例【例7.37.3】n利用例7.2的數據,但將第二層和第四層的觀測值次序顛倒,數據如下:層 等距樣本編號層均值123456781113345673.75216 1614121188711.5317 18202024 24 25 27 21.875438 36343431 30 28 2732.25總數72 71716970 67 67 68_202. 0)(1)()(122krrsysyYykYyEyV此時,等距抽樣均值估計的方差為:516. 23243245 .11)()(2NnNnSyVwstst333.28

21、45232.12932432)(2SNnnNyVsrs而分層隨機抽樣和簡單隨機抽樣均值估計的方差不變:可見:本例中,改變數據順序后,等距抽樣比簡單隨機抽樣和分層隨機抽樣更有效。n上述例子說明:n相對于分層隨機抽樣和簡單隨機抽樣來說,系統抽樣的效率很大程度上取決于總體性質。n即使是相同的總體數據,對于不同的單元排列順序,就有不同的樣本(群)內方差和相關系數,從面系統抽樣估計量的方差也不同。n因此,要有效地應用系統抽樣,必須先了解總體的特征。第三節第三節 不同特征總體的系統抽樣不同特征總體的系統抽樣一一.隨機次序排列的總體隨機次序排列的總體總體單元按無關標志排列,如居民家計調總體單元按無關標志排列

22、,如居民家計調查按居民姓氏次序排列的總體單位。查按居民姓氏次序排列的總體單位。 n對于一個有限總體對于一個有限總體,簡單隨機抽樣的方差是確定簡單隨機抽樣的方差是確定的的,系統抽樣的方差則取決于單元的排列順序系統抽樣的方差則取決于單元的排列順序.n對于特定的排列,系統抽樣的方差可能比相應的對于特定的排列,系統抽樣的方差可能比相應的簡單隨機抽樣的方差大,也可能比它小。簡單隨機抽樣的方差大,也可能比它小。N個總個總體單元總共有體單元總共有N!種不同的排列,從而有種不同的排列,從而有N!個個系統抽樣的方差。系統抽樣的方差。n但可以證明這但可以證明這N!個系統抽樣方差的平均數恰好個系統抽樣方差的平均數恰

23、好等于簡單隨機抽樣的方差。等于簡單隨機抽樣的方差。n在這個意義下,我們說當總體單元按隨機順序排在這個意義下,我們說當總體單元按隨機順序排列時,系統抽樣的效果等價于簡單隨機抽樣。列時,系統抽樣的效果等價于簡單隨機抽樣。n當總體單元按無關標志排列時,可以采用簡單隨機抽樣的方差作為系統抽樣的方差估計:221)()(SnfSNnnNyVyVsrssyn二. 線性趨勢的總體n(一)線性趨勢的總體n當總體按指標值從小到大順序列時,由于樣本(群)內方差增加而使系統抽樣的精度有顯著的提高。n在實際問題中,當然不可能按指標值的大小 排列,但是常可以找到某個與指標值相關的奕量,若單元按這個變量大小排列,則可收到同

24、樣的效果。n假定單元指標Yi值是單元序號 i的線性函數,即Yi=a+bi(i=1,2,N)iiYbaYi)()和(、stsrssyyVyVyV)() 12)(1(61) 1(21112211NNNiYNNiYNiNiiNiNii現比較當Y i=i時,有總體均值總體均值總體方差總體方差) 1(21NY) 1(121)(11)(11122122NNYNYNYYNSNiiNii) 1)(1(1212NkSnNnNyVsrs)() 1(121) 1(121)(22knkkNnnNSNnnNyVwst) 1(121)(1)(221kYykyVkrrsy)()(srssystyVyVyV)(二. 對線性趨

25、勢總體的系統抽樣法的改進n針對實踐中經常出現的線性趨勢總體,有必要對系統抽樣進行改進,從而提高系統抽樣的精度,使系統抽樣法有可能達到比分層隨機抽樣更高的效果。n改進的方法有兩類:n一是抽樣方法的改進,如中心位置抽樣法,對稱系統抽樣法;n二是估計方法的改進,如首尾校正法.n n1. 抽樣方法的改進n(1)中心位置抽樣法(中位樣本法)n 由麥多Madow(1953) 提出,即初始樣本不是隨機抽選,而是直接取第一段的 k個單元中處于中間位置的單元.如果K為奇數,以(K+1)/2為起點,K為偶數,以K/2或(K+2)/2為起點。 n【例】從【例】從200200名學生中抽名學生中抽1010名學生作為樣名

26、學生作為樣本本, ,k=N/n=200/10=20, k=N/n=200/10=20, 若起始樣本是若起始樣本是10,10,則其則其余的依次為余的依次為30,50,70.90,110,130,150,170,190.30,50,70.90,110,130,150,170,190.n評價:n優點:中心位置抽樣法抽到的樣本單元都位于層的中心位置,從而最大限度地減了方差。n缺點:當總體單元順序和k確定以后,樣本也隨之確定,無隨機可言,這與概率抽樣的要求相悖。n因此,對一個項目偶爾為之尚可,但若要多次抽樣估計就不能用這種方法。n(2)對稱(平衡)系統抽樣n 既希望克服中位數方法的缺乏隨機性,又希望避免

27、有些系統樣本估計量過大的偏倚,并希望保留傳統抽樣的特點,這三種要求很容易啟發我們采用一種“對稱系統抽樣法”.n對稱等距抽樣也是針對有序等距抽樣所提出的,其基本思想是使低標志值的單元與高標志值的單元在樣本中對等出現。從而使樣本的偏差縮小,代表性增強。n由于具體的方法不同,對稱等距抽樣又有幾種類型。A. A. 塞蒂塞蒂SethiSethi對稱系統抽樣對稱系統抽樣(1965):(1965): - - 層內對稱系統抽樣層內對稱系統抽樣n 設N=nK,n為偶數。n 首先:將總體按順序劃分為n/2組(以每一組為層),每組由2k個單元組成。n其次:在第一組中以隨機方法確定兩個初始單元,方法是在1k范圍內產生

28、一個隨機數r,則單元r與單元2k-r+1即為起始單元。這兩個單元在層中的位置是對稱的。n 最后,在其余各層中與上述兩個起始單元相同位置的單元都是樣本單元,例如,在第二個抽樣間隔所抽兩個樣本單元號碼為r+2K及2(2k)-r+1,依次類推。n 也就是說n/2對對稱的樣本單元的編號為: 12, 2 , 1 , 0 1) 1(2,2njrkjjkrn【例】上例中【例】上例中, ,N=200,n=10N=200,n=10為偶數:若起為偶數:若起始樣本是始樣本是3,3,則抽取的樣本為則抽取的樣本為n3 3,38,43,78,83,118,123,158,163,198.38,43,78,83,118,1

29、23,158,163,198.n當n為奇數時,式中的j由0變到(n-1)/2-1為止,并且,要加上接近末端的第r+(n-1)K個單元。n=200, n=5, k=40, 則抽取的樣本為:3, 78, 83, 123, 163. 【例】【例】 n實際中,為便于對稱等距抽樣的實施,當N=nK時,可以將原來由小到大(或由大到小)順序排列的單元按照順逆交替的次序排列在一個表中,這樣,按隨機起點等距抽樣所抽取的樣本即為對稱等距樣本。n所謂順逆交替是指在單元的排序中,若第一間隔由小到大排序,則第二間隔按由大到小排序,以此類推。 nB.辛方(Singn)對稱系統抽樣(1968):n -總體對稱系統抽樣n仍設

30、N=nK。當n為偶數時n首先,在1k范圍內產生隨機數r作為起始單元,同時,另一起始單元為距另一端點距離為r的單元,即編號為N-r+1的單元。這兩個單元相對總體是對稱的。n然后,與第二個抽樣間隔中r+K對稱的是倒數第二個抽樣間隔的(N-K)-r+1;如此,一直抽到中間兩個抽樣間隔為止。n因此,全部n/2對樣本單元的編號為:12,2 , 1 , 0 1)(,njrjkNjkr 從300名學生中抽取15位作為樣本,即N=300,n=15,k=300/15=20,設起始單元數為,則樣本單元位數依次是3,298,23,278,43,258,83,218,103,198,123,178,143.【例】【例

31、】 n當n為奇數時,式中的j由0變到(n-1)/2-1為止。然后,再加上中間一個抽樣間隔中的第r+(n-1)K/2個單元。(我國抽樣調查工作者提出在中間一個抽樣間隔抽取中點處的一個單元。) 2.首尾校正法首尾校正法(兩端修正法 )抽樣方法同隨機起點等距抽樣時的情形。但在計算總體均值的估計量時,通過對首尾兩個單元賦予不同于其他單元的權數,從而降低對線性趨勢總體的系統抽樣的估計偏倚()耶茨Yates首尾校正法首尾校正法 條件:條件:nk 方法:方法:對首尾兩個樣本單元賦予不同于其他單元的權數,采用加權平均計算樣本均值,從而提高精度n設起始樣本單元的編號為r, 則n首樣本單元的權數為:n尾樣本單元的

32、權數為:n其他n-2個樣本單元的權數為:knkrnw) 1(21211knkrnwn) 1( 21211,.,2 , 1,1njnwj首尾校正法修正后的總體均值估計量:首尾校正法修正后的總體均值估計量: 當當i 是是i 的線性函數時,首尾校正法的的線性函數時,首尾校正法的均值估計量是完全無偏的,完全不受初均值估計量是完全無偏的,完全不受初始值的影響始值的影響njrjjrywy1knbnxnkrbaknrbanxbranxjkrbanywynjnjrjjr) 1()21() 1()()(1101權數公式的推導如下:令第一樣本觀測值的權為:)1 (1xn最末一個樣本觀測值的權為:)1 (1xn則:

33、為使:) 1(21NbaYyr則可解得:knkrnx) 1(2) 12(n例:若總體單元指標值按其順序為1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,抽取一個n=3的系統樣本,用耶茨首尾校正法估計總體均值 .解:N=15,n=3,k=5。不妨假設隨機抽取的起始值r=1,則樣本觀測值為1,11,21。若不加校正,總體均值的估計為:11)21111 (311 yysy此估計值比實際總體均值 小很多。若采用耶茨的首尾校正法, 的估計值為:Y15YY156 .33114 . 031522) 152(31 2111522) 152(31 131Yy從而校正后的估計值完全

34、與估計目標量的真值相等。(2)貝爾豪斯Bellhouse和拉奧Rao(1975)首尾校正法首尾校正法條件:采用循環等距抽樣法抽樣保證n為常數然后按照總體單元原有的順序確定首尾單元總體單元原有的順序確定首尾單元,對其賦予不同于其他單元的權數nkN 首樣本單元的權數為:knNknrnw) 1( 2) 1() 1(211尾樣本單元的權數為:其他n-2個樣本單元的權數為:knNknrnwn) 1( 2) 1() 1(211,.,2 , 1,1njnwjn如果初始單元編號r 較小,滿足則所有n個樣本單元都不經過單元,相應的權數如下:,) 1(Nknr如果初始單元編號r 較大,滿足 則有樣本單元越過單元,

35、假設越過單元的樣本單元有個,相應的權數如下:,) 1(Nknr2n)(22) 1() 1(2121kNnNnNknrnw首樣本單元的權數為:尾樣本單元的權數為:)(22) 1() 1(212kNnNnNknrnwn其他n-2個樣本單元的權數為:1,.,2,1,1njnwj【例【例7.4】總體有】總體有23個單位,擬抽取個單位,擬抽取n=5, 則則與之最近的整數與之最近的整數k=5然后在總體中隨機抽然后在總體中隨機抽取一個單位作為起點,假設抽中取一個單位作為起點,假設抽中r=19, 樣樣本單元的順序編號分別為:本單元的順序編號分別為:19,1,6,11,16 首樣本單元為首樣本單元為y1,尾單元

36、為尾單元為y19.求相應單元的權數求相應單元的權數首樣本單元y1的權數為:1222. 0)(22) 1() 1(2121kNnNnNknrnw尾樣本單元的權數為:2778. 0)( 22) 1() 1(212kNnNnNknrnwn其他3個樣本單元的權數為:0.2解:解:n2=,=23, n=5, k=5, r=19三周期波動的總體三周期波動的總體周期波動是指總體單元指標值按其順序呈周期性變周期波動是指總體單元指標值按其順序呈周期性變化化n一般對含有周期影響的總體,如果已經掌握了其周期結構,合理選擇系統抽樣間距k,使樣本包含周期中許多有代表性的指標值,可以大縮小估計量的方差,采用系統抽樣的效果

37、很好,n但對總體的周期結構不了解,則簡單隨機抽樣與分層隨機抽樣的效果可能會更好第四節系統抽樣的方差估計第四節系統抽樣的方差估計n一.等概系統抽樣的方差估計(一)系統樣本來自隨機排列總體nisyiyynnNnNsnfv1221)(111(二)系統樣本分層隨機抽取 如果把系統樣本看成從各層抽取兩個單位的分層隨機抽樣,可采用下列方法:n1.從第二個樣本單元開始,每個樣本單元與前一個樣本單元組成一對,共n-1對,第 i對樣本單元的方差估計為 ,因此對n-1個 進行平均,再乘以 ,得 的估計:21)(21iiyy21)(21iiyynf1)(syyV211111212)() 1(2)() 1(211ni

38、iiniiiyyNnnnNyynnfv2.設n為偶數,將樣本單元按順序兩兩分成一組,共n/2組,第i對樣本單元的方差估計為 ,將這n/2個方差估計值進行平均,再乘以 ,從而得到2122)(21iiyynf121212222121223)()(2121niiiniiiyyNnnNyynnfv(三三)系統樣本來自線性趨勢總體系統樣本來自線性趨勢總體iiebiaY),.2 , 1(Ni 0)(,)(, 0)(22jiiieeEeEeE進行Yates首尾校正后:) 1() 1( 212knyyknkryYrrn其抽樣方差無偏估計為:當n 較大時,可忽略.但當線性模型存在異方差時, 不再是無偏估計.212212224)2(6)2() 1(2) 12(11niiiinyyyknkrnnkkv)(Yv(四)樣本量為n的系統樣本分成m 個子樣本獨立抽樣(交叉子樣本法,隨機組法)n將樣本量為n的系統樣本分成m個子樣本獨立抽取,每個仍用系統(等距)抽樣,樣本量為 ,抽樣間距為 ,每個子樣本的起始值獨立抽取。n記第a個子樣本的均值為 ,則總體均值的估計為: mnn ,mkk maaymY11ay)(YV的一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論