根據抽樣設計分析數據_第1頁
根據抽樣設計分析數據_第2頁
根據抽樣設計分析數據_第3頁
根據抽樣設計分析數據_第4頁
根據抽樣設計分析數據_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、中國勞動力2012:根據抽樣設計分析數據一、簡介本次采用的是分層四階段不等概率抽樣,具體為將中國(不含自治區、海南和臺)共 2282 個區縣作為初級抽樣單元(PSU)總體,劃分為 6 大層進行抽樣:各階段的抽樣為:第一階段:以區(地級市、省會城市和直轄市的各大城區和郊區)、縣(包括縣級市)為初級抽樣。第二階段:以街道、鄉鎮為二級抽樣。第三階段:以居民、村民為三級抽樣。第四階段:以家庭住戶為最終。二、根據抽樣設計分析數據的必要性大多數統計分析所講述的統計推論方法都是基于簡單隨機抽樣(或者系統隨機抽樣)的樣本。使用的社會數據在以下面與之不同,因而在分析時需要進行校正。1. 入樣概率的影響大型通常使

2、用不等概率抽樣,導致不同的家庭或人進入樣本的概率不同。在本中,由于不同家庭中的勞動力數量不同,對入樣的勞動力,需要加權以調整其在家庭中被抽取的概率。即使在抽樣設計中按照相等概率抽取家庭,1地區小省層大省層東部、市、市、遼寧省、浙江省、福建江蘇省、山東省、省中部山西省、吉林省、省、江西省、省、廣西省、重慶市河北省、黑龍江、省、湖南省、省西部省、青海省、自治區、內、省、云南省、陜西省不同家庭的實際入樣概率也會不同。例如:不同社會群體對的應答率不同,因此需要給予應答率低的群體更大的權數以保證樣本的代表性。2. 整群抽樣(cluster sling)的影響出于降低成本的考慮,在大型中通常使用整群抽樣,

3、而不是簡單隨機抽樣或者系統隨機抽樣。例如當在抽中了區縣后,之后抽取街道/鄉鎮,居委會/村委會,以及家庭的時候是在抽中的區縣抽取。這樣會導致一個后果,即同一個區縣里的家庭(或個人)會更相似,而會低估了不同區縣的家庭(或個人)之間的差別,于是在進行統計推論時就會低估標準誤。因此也需要因應整群抽樣的特點進行校正。在此需要,雖然整群抽樣會低估樣本的異質性,但分層抽樣能夠在一定程度上對此進行彌補。3. 無放回抽樣(sling without replacement)的影響大多數統計分析講述抽樣設計的時候,都假定樣本是有放回的(slingwith replacement)。換言之,在 100 個人里隨機抽

4、取 10 個人,如果抽中的第一個人為 A,那么在抽取第二個人時會把 A 放回這總體中,然后再進行抽樣,以保證每個人被抽中的概率不變。在實際操作中,如果之后抽樣時再抽中A,由于 A 的信息已經知道了,會忽略 A。但如果不把 A 放回,又會導致樣本框中后抽中的人的入樣概率會高于先抽中的人。因此要對無放回的抽樣方式導致的結果進行有限總體校正(finite population correction)。三、設置抽樣設計信息:以 Sa為例第一步:設定抽樣設計信息在分析復雜抽樣數據時,需要先通過 svyset 模塊告知 Sa該的抽樣設計。如果使用的是家庭數據,研究者應在 Sa 中輸入:svyset nco

5、de pw=wfp, strata(strata) fpcode) | scode上面命令中標注為紅色的是提供的跟抽樣設計有關的變量。其中 strata是分層的層變量,ncode 是初級抽樣(Primary Sling Unit,PSU),scode通過這 3 個變量告知是次級抽樣(Secondary Sling Unit,),2Sa 該數據是多階段分層整群抽樣。fpc 表示有限總體校正(Finite PopulationCorrection),調用的變量是 nncode(注意不是 ncode)。pw 表示抽樣權數,調用的變量是 wfp,這個變量是家庭權數變量,如果使用的是勞動力數據,則應相應

6、改為 wpp,即svyset ncode pw=wpp, strata(strata) fpcode) | scode第二步:通過 svy 調用設定的信息進行分析用 svyset 設定抽樣設計的信息后,進行分析時必須用 svy 作為前綴才能進行調用。如果沒有調用抽樣設計信息,分析結果將會。下面以勞動力數據為例介紹 svy 的用法(I1_1 是)。3如果分析的是一個子樣本,則需要用 svy 的 subpop 選項進行設定。subpop里的變量取值為 1 則為該子樣本,為 0 則不是為該子樣本。例如要計算的均值(該例中 male 變量取值為 1 是,取值為 0 是女性):如果子樣本是多個條件的組合

7、,也可以在 subpop 選項里設定。例如要黨員的均值(I1_6 為政治面貌:1 表示黨員,2 表示計算黨派,3 表示群眾):4也可以用 over(I1_9_6)按被訪者現在的戶口性質(農業/非農)計算黨員的均值。5支持 svy 前綴的常用 Sa 命令:估計平均值svy: svy: svy:svy:mean (注意沒有 svy: sum 這個命令)tab reglogit / probit / mlogit / ologit單變量分布或雙變量交互表線性回歸模型其他回歸模型/tobit / poisson / heckman感的研究者也可以在 Sa 里面輸入 helpsvy_estimation 查看其他 svy 估計命令的用法。11如果你使用的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論