抽樣調查第7章系統抽樣_第1頁
抽樣調查第7章系統抽樣_第2頁
抽樣調查第7章系統抽樣_第3頁
抽樣調查第7章系統抽樣_第4頁
抽樣調查第7章系統抽樣_第5頁
已閱讀5頁,還剩66頁未讀, 繼續免費閱讀

付費下載

VIP免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

抽樣調查-第7章系統抽樣2023/12/27抽樣調查第7章系統抽樣

系統抽樣的特點

系統抽樣是一種被廣泛采用的抽樣方法,系統抽樣比簡單隨機抽樣易于操作,但抽樣誤差的估計比較復雜。實踐中,各種抽樣調查,如人口調查、產品質量調查、城鄉居民調查等都普遍采用系統抽樣。系統抽樣中最簡單也是最常用的規則是等間隔抽取,這種系統抽樣又稱等距抽樣。抽樣調查第7章系統抽樣二、系統抽樣的一般方法1.直線等距抽樣假設總體單元數為N,樣本容量為n,N是n的整數倍.首先計算抽樣間距,把總體分為n段,每段k個單元,然后在第一段的k個單元中隨機抽出一個單元,假設為r,然后每隔k個單元抽出一個單元.即直到抽出n個單元.抽樣調查第7章系統抽樣例如

某學院共有200個學生,要抽10個學生做樣本首先計算抽樣間距然后在1~20中隨機抽出一個數字,假設抽中排在第3位的學生,則其余樣本單元依次為第23,43,63,83,103,123,143,163,183位共10個學生抽取.抽樣調查第7章系統抽樣2.循環等距抽樣

當N不是n的整數倍,即抽樣間距不是整數時,實際抽取的樣本量是不確定的,每個總體單元入樣的概率也是不等的,這時用直線等距抽樣就有可能產生偏倚,若采用循環等距抽樣則可以解決此問題.其方法是將N個總體單元排成首尾相接的一個圓從1到N中隨機抽取一個起點作為起始單元,然后每隔k個單元抽出一個,直到抽出n個單元為止.抽樣調查第7章系統抽樣循環等距抽樣例如總體有14個單元,欲抽取n=3,則取與之最近的整數然后在總體中隨機抽取一個單元作為起點,假設抽中3,即依次抽取直到抽滿。因此樣本的編號為:3,8,13。81110133176452912抽樣調查第7章系統抽樣3.不等概系統抽樣法不等概系統抽樣中每個單元的入樣概率不相等.最常用也是最簡單的不等概系統抽樣是抽樣.即入樣概率與單元大小成比例的系統抽樣.令表示總體所有單元大小的總和,則實施不等概系統抽樣最簡單的方法是代碼法:下面以例7.1來說明【例7.1】設總體由10個行政村組成,N=10,每個行政村的人數見下表.利用系統抽樣抽取n=3個行政村.抽樣調查第7章系統抽樣行政村編號人數(Mi)累計人數抽中代碼12345678910103432962468473205168146317103535631877961103412391407155318701007231346用系統抽樣抽選行政村抽樣調查第7章系統抽樣從[1,k]中隨機抽取一個整數r=100,則代碼為:r=100,r+k=100+623=723,r+2k=100+2×623=1346,所對應的行政村入樣,其序號依次為1,4,8.

在系統抽樣中,對于特別大的單元一定要注意.如果出現,該單元肯定被抽入樣本,而且還可能被重復抽到.為了避免這種情況,可以事先將這些單元抽出直接入樣.抽樣調查第7章系統抽樣三、總體單元的排序

系統抽樣時N個總體單元的排序情況大致有以下三種:(1)按無關標志排隊(2)按有關標志排隊(3)介于上述兩者之間抽樣調查第7章系統抽樣四、系統抽樣的優缺點系統抽樣的優點:1.簡便易行,容易確定樣本單元2.樣本單元在總體中分布比較均勻系統抽樣的缺點:1.如果單元的排列存在周期性的變化,而抽樣者對此缺乏了解或缺乏處理經驗,抽取的樣本的代表性就可能很差。2.系統抽樣的方差估計較為復雜,一般不存在無偏估計量。抽樣調查第7章系統抽樣五、系統抽樣、整群抽樣和分層抽樣的關系

系統抽樣既可以看成一種特殊的整群抽樣,又可以看成一種特殊的分層抽樣。下面以一般的等距抽樣為例說明:

假設抽樣間距為k,總體單元數為N=nk。將總體的N個單元排列成k行n列,如下表所示。表中的每一行單元都是系統抽樣的一個樣本。抽樣調查第7章系統抽樣系統抽樣的總體單元12jn平均12rk抽樣調查第7章系統抽樣12jn群平均12rk層平均令得下表:如果將每一行單元視為一個群,則總體由k個群組成每個群的大小都是n。系統抽樣就是從中任選~一個單元,被選中單元所在行的所有單元就構成系統抽樣的一個樣本。抽樣調查第7章系統抽樣§7.2等概率系統抽樣估計量一、符號說明第r行第j列的單元指標值:總體單元數:N樣本單元數:n系統樣本平均數:系統樣本均值估計量:層均值:總體方差:系統樣本內方差:抽樣調查第7章系統抽樣樣本內相關系數:層內方差:同一系統內對層均值離差的相關系數:二、估計量假設起始值為R,相應系統樣本的平均值為:抽樣調查第7章系統抽樣取系統樣本的平均數作為總體均值的估計量:性質1

當N=nk時,有k個可能樣本:因此是無偏估計量。是有偏的。個可能樣本所包含的單元數不全相等,因此但是當時,采用直線等距抽樣得到的抽樣調查第7章系統抽樣三、估計量方差的不同表示形式為方便起見,以后均假定時,系統樣本的平均數作為總體均值的估計是無偏的。它的方差按定義為:下面給出方差的三種不同的表示形式。形式一

用樣本內方差表示系統抽樣估計量的方差。抽樣調查第7章系統抽樣式中,為總體方差;為樣本內方差。如果從總體N中直接抽取樣本量為n的簡單隨機樣本,則總體均值的估計量的方差為:式中,為總體方差;n為樣本量;f為抽樣比。抽樣調查第7章系統抽樣

對于固定總體,總體方差是惟一確定的,因此,系統樣本內的方差越大,系統抽樣的精度越高.為了提高系統抽樣的精度,總體單元的排列應盡可能增大樣本內方差。比較等距抽樣方差和簡單隨機抽樣方差,抽樣調查第7章系統抽樣形式二

系統抽樣可看作一種特殊的整群抽樣系統抽樣估計量的方差可以用樣本內相關系數表示:式中,為樣本內相關系數。系統樣本內正相關越大,即系統內單元越相似,則估計量方差越大,等距抽樣精度越差。抽樣調查第7章系統抽樣形式三、系統抽樣可看做一種特殊的分層抽樣,系統抽樣估計量的方差可以用層內方差表示:式中,為層內方差;為同一系統樣本內對層均值離差的相關系數。比較系統抽樣方差與比例分配的分層隨機抽樣方差,比例分配的分層隨機抽樣總體均值估計量的方差。抽樣調查第7章系統抽樣

因此當系統抽樣的精度低于分層隨機抽樣;系統抽樣的精度與各層抽取一個單元的分層隨機抽樣相同;系統抽樣的精度高于分層隨機抽樣。抽樣調查第7章系統抽樣【例6.3】

設某總個體N=30個單元,總體單元排列如下表,我們要產生一個樣本量n=5為的系統樣本,試與其他抽樣方法的結果進行比較。

下面通過一個模擬的例子說明系統抽樣與其他抽樣方法的聯系,并對不同抽樣方法的效果進行比較。抽樣調查第7章系統抽樣N=30,k=6,n=45等距樣本數據12345群平均群內方差1111213141513.002.52111213141513.002.53111213141513.002.54111213141513.002.55111213141513.002.56111213141513.002.5層平均11.0012.0013.0014.0015.0013.002.5層內方差0000002.07抽樣調查第7章系統抽樣從上表可計算出:總體方差平均群(行)內方差平均層(列)內方差下面我們按不同的抽樣方法計算總體均值估計量的方差。抽樣調查第7章系統抽樣(1)以行為群的整群抽樣或以行為“系統樣本”的系統抽樣k=6,n=5.抽樣調查第7章系統抽樣(1)以行為群的整群抽樣或以行為“系統樣本”的系統抽樣k=6,n=5.抽樣調查第7章系統抽樣(2)以列為群的整群抽樣或以列為“系統樣本”的系統抽樣k=5,n=6.抽樣調查第7章系統抽樣(3)以行為層的分層隨機抽樣(每層抽1個單元)L=6,n=6,f=6/30.(4)以列為層的分層隨機抽樣(每層抽1個單元)L=5,n=5,f=5/30.抽樣調查第7章系統抽樣(5)簡單隨機抽樣n=5,f=5/30.(6)簡單隨機抽樣n=6,f=6/30.抽樣調查第7章系統抽樣【評價】從上面的結果可以看出:(1)像整群抽樣一樣,系統抽樣的估計精度幾乎完全取決于其“系統樣本”內差異與總體差異的對比。(2)系統抽樣與其他抽樣方法相比其優劣難以定論,可能好也可能差,這完全取決于其“系統樣本”內差異與總體差異的對比,而這個對比則取決于系統抽樣中的總體單元排列順序。(3)另外三種方法的比較同樣難定優劣,都需要具體情況具體分析。我們下面將上表中總體單元的順序重新排列,來研究總體單元不同排列對系統抽樣的影響。抽樣調查第7章系統抽樣依某種隨機化程序將總體單元重新排列12345群平均群內方差1111211121513.002.692111211121513.002.693111213141513.002.504111213141513.002.505131413141513.000.706131413141513.000.70層平均11.6712.6712.3313.3315.0013.00層內方差1.071.071.071.07002.07抽樣調查第7章系統抽樣從上表可計算出:總體方差平均群(行)內方差平均層(列)內方差下面我們按不同的抽樣方法計算總體均值估計量的方差。抽樣調查第7章系統抽樣(1)以行為群的整群抽樣或以行為“系統樣本”的系統抽樣k=6,n=5.抽樣調查第7章系統抽樣(2)以列為群的整群抽樣或以列為“系統樣本”的系統抽樣k=5,n=6.抽樣調查第7章系統抽樣(3)以行為層的分層隨機抽樣(每層抽1個單元)L=6,n=6,f=6/30.(4)以列為層的分層隨機抽樣(每層抽1個單元)L=5,n=5,f=5/30.抽樣調查第7章系統抽樣(5)簡單隨機抽樣n=5,f=5/30.(6)簡單隨機抽樣n=6,f=6/30.抽樣調查第7章系統抽樣【評價】將此結果與上例結果比較我們不難發現:(1)簡單隨機抽樣的方差未變,說明簡單隨機抽樣的結果與順序無關;(2)系統抽樣、整群抽樣以及分層抽樣都與單元順序有關,這表明在選擇抽樣方式時,必須盡可能多地掌握有關單元的順序和總體結構和特點。(3)本例中分層抽樣方差的結果優于簡單隨機抽樣,而簡單隨機抽樣優于系統抽樣和整群抽樣。抽樣調查第7章系統抽樣【例6.5】

設某個總體有N=32個單元,總體單元排列顯然有穩定上升的趨勢。我們要產生一個樣本量為4的等距樣本,將總體單元排列如下表,k=8,n=4,每一列都是一個等距樣本。共8個等距樣本。抽樣調查第7章系統抽樣層ⅰⅱⅲⅳ等距樣本編號層平均3.7511.521.87532.251234567817172718182838203031120314122434514243461625367162738總數5255616574778388------N=32,k=8,n=4等距樣本數據抽樣調查第7章系統抽樣

顯然,層內有正相關,前4個樣本與各層均值的離差都是正數,后4個樣本與各層均值的離差都是負數,由性質4,當時,系統抽樣的精度低于分層隨機抽樣.層內方差與總方差分別為:抽樣調查第7章系統抽樣

因此,簡單隨機抽樣均值估計的方差、分層隨機抽樣均值估計的方差以及等距抽樣均值估計的方差如下:抽樣調查第7章系統抽樣【例7.3】利用例7.2的數據,但將第二層與第四層的觀察值次序顛倒,數據見下表:層ⅰⅱⅲⅳ等距樣本編號層均3.7511.521.87532.251234567811617381161836314203431220344112431582430682528772727總數7271716970676768------抽樣調查第7章系統抽樣

顯然,等距樣本內數據與各層均值得離差有正有負,例如第一個等距樣本對各層均值的離差分別為-2.75,4.5,-4.875,5.75.該樣本內六對離差組合中四對的乘積是負數.因此,由性質4,,系統抽樣的精度高于分層隨機抽樣.

數據順序的這種改變不會影響簡單隨機抽樣均值估計的方差和分層隨機抽樣均值估計的方差。這時等距抽樣均值估計的方差為:抽樣調查第7章系統抽樣

本例中,等距抽樣比簡單隨機抽樣和分層隨機抽樣都更有效。由此可見,相對于分層隨機抽樣和簡單隨機抽樣來說,系統抽樣的效率很大程度上取決于總體性質。即使是相同的總體數據,對于不同的單元排列順序,就有不同的樣本群內方差或相關系數從而系統抽樣估計量的方差也就不同。因此,若要有效地采用系統抽樣,必須先了解總體的特征。抽樣調查第7章系統抽樣§6.3方差估計及其改進一、方差的近似估計

雖然有各種各樣的估計量方差的理論公式,但難以得到抽樣估計量方差的無偏估計,這是系統抽樣的最大的缺點。因此,許多從事抽樣設計的業者在決定是否采用系統抽樣時往往猶豫不決。為此,我們分別針對幾種不同總體模型,介紹幾種近似估計方法,以期選擇較為合適的估計量。抽樣調查第7章系統抽樣(1)隨機次序排列的總體

按照無關標志排列的總體單元,可以看著是隨機排列的。在這種情況下,系統抽樣方差與簡單隨機抽樣方差是相等的。即總體單元按隨機排列順序時,就可以采用簡單隨機抽樣的方差作為系統抽樣的方差估計。抽樣調查第7章系統抽樣方差估計為:估計量的方差為:抽樣調查第7章系統抽樣趨勢排列情形當總體存在或很易找到與研究變量相關程度較高的輔助變量作為排序依據時,或是自然的排列順序與總體單元的變量值的大小分布呈現某種相依或相悖的趨勢時,總體單元的排列順序就處于趨勢排列狀態,其中線性趨勢最為典型。對于來自趨勢排列總體的等概系統樣本,通??梢暈榉謱訕颖?,其整體均值的估計為:抽樣調查第7章系統抽樣抽樣方差的無偏估計為:抽樣調查第7章系統抽樣二、線性排列情形抽樣與估計的改進1.線性趨勢的總體若總體單元按指標值從小到大順序排列或按某個與其有線性相關的輔助變量的大小順序排列,此時指標值與單元序號也線性相關.這種按有關標志排列的總體稱為線性趨勢的總體,如下圖所示.抽樣調查第7章系統抽樣我們先假定一種簡單的線性趨勢總體,即單元指標值是單元序號i的線性函數,即經過線性變換后,記以下仍用表示系統抽樣抽樣調查第7章系統抽樣在具有線性趨勢總體下,比較系統抽樣的方差、簡單隨機抽樣的方差、分層隨機抽樣的方差它們的差別。當時,有故總體均值總體方差抽樣調查第7章系統抽樣從而簡單隨機抽樣的方差:分層隨機抽樣的方差:系統抽樣的方差:比較三式可知等號當且僅當時成立。抽樣調查第7章系統抽樣2.對線性趨勢總體的系統抽樣法的改進雖然嚴格的線性趨勢排列總體在實際問題中很難成立,但其結論在定性上還是適合的.為了使系統抽樣法達到更高的精度,有必要對線性趨勢總體的系統抽樣法進行改進.主要有兩個途徑:一種是抽樣方法的改進;(如中心位置抽樣法和對稱系統抽樣法)另一種是估計方法的改進(如首尾校正法).(1)中心位置抽樣法初始樣本不是隨機抽取,而是直接取第一段的n個單元中處于中間位置的單元.抽樣調查第7章系統抽樣中點取奇數時,當k為偶數時,當k為中點取(2)對稱系統抽樣法Sethi對稱系統抽樣法(P206)Singn對稱系統抽樣法(P207)(3)首尾校正法Yates首尾校正法Bellhouse和Rao首尾校正法(見P205)抽樣調查第7章系統抽樣Bellhouse和Rao首尾校正法如果初始單元編號r較大,滿足r+(n-1)k>N,則有越過單元N的樣本單元有n2個,相應的權數如下:抽樣調查第7章系統抽樣【例7.4】總體有23個單位,擬抽取n=5,則取與之最近的整數k=5。然后在總體中隨機抽取一個單位作為起點,假設抽中r=19,樣本單位的順序編號分別為:19,1,6,11,16。首樣本單元為,尾單元為。求相應單元的權數。,6.4==nNk抽樣調查第7章系統抽樣解:由于其他3個樣本單元的權數為:0.2首樣本單元的權數為:尾樣本單元的權數為:抽樣調查第7章系統抽樣三、周期波動的總體

周期性波動是指總體單元指標值按其順序程周期性變化.例如商店的日銷售額以7天為周期變化,一般周末為銷售高峰期,周一、周二下降;城市交通量以24小時為周期變化,上下班時間為高峰期。對于周期性波動總體,使用系統抽樣一定要特別注意。系統抽樣的估計效果與抽樣間距k及單元指標值的變化周期直接的關系。抽樣調查第7章系統抽樣§7.4系統抽樣的方差估計

系統抽樣法的缺點之一,就是很難得到估計方差的無偏估計。本節介紹幾種形式相對簡單的估計方法,這些方差估計方法只能進行近似計算而且不同的方法適應于不同的總體模型。一、等概系統抽樣的方差估計我們討論用估計總體均值時的方差的估計。(一)系統樣本來自隨機排列總體系統樣本可視為簡單隨機樣本,從而可用簡單隨機抽樣下的抽樣方差的無偏估計:抽樣調查第7章系統抽樣(二)系統樣本分層隨機抽取如果把系統樣本看成從各層抽取兩個單位分層隨機抽樣,可采用以下方法。1。從第二個樣本單元開始,每個樣本單元與前一個樣本單元組成一對,共n-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論