




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、抽樣調查中的無應答替換與應答率郝大海2012-8-28 15:24:17來源:統計與決策(武漢)2008年11期第710頁【作者簡介】郝大海,中國人民大學 社會與人口學院。(北京 100872)【內容提要】 文章旨在澄清抽樣調查中無應答替換對應答率計算的影響。首先在調查中若對無應答單位進行“替換”處理,應對替換前后的樣本單位做出區分,計算相應的“初始應答率”,并在應答率不變的假設下,用初始應答率來代替調查應答率。如果在調查執行中,未能全面保留相關執行資料,可以利用實際接觸的住戶數和訪談成功數,對應答率進行事后估算。可以證明如果樣本替換中應答率保持不變,則按事后估算公式計算出的應答率估算值,在數
2、值上與初始應答率是相等的。無應答替換方法包括明顯替換、補充抽樣和二重抽樣等,其中前兩種方法由于是獨立抽樣,存在著用應答單位替換無應答單位的困境。 【關 鍵 詞】無應答替換/初始應答率/應答率不變假設中圖分類號:O212文獻標識碼:A文章編號:10026487(2008)11000703在抽樣調查中,“應答率是評估收集的資料有效性的基本參數,即接受訪談(或應答單位)的人數除以樣本的人數(或單元數)。分母包括了從總體中抽取的所有人,即包括那些雖被抽中但因拒絕、語言問題、疾病或者缺乏易得性而沒有應答的人”(福勒,20042003,第41頁)。在調查執行中,對于無應答現象 通常有兩種處理方法, 一種是
3、對無應答單位不做替換,另一種則是用替換樣本進行無應答替換。一定程度上,無應答替換增加了應答率計算的難度。本文將具體分析無應答替換對應答率計算的影響,然后在此基礎上給出應答率的事后估算方法和無應答替換方法,最后討論無應答替換的意義。1無應答替換的影響在調查執行中,如果對無應答單位不做替換,則應答率的計算相對簡單,即用接受訪談的人數(或應答單位數)除以總樣本人數(或樣本規模)。設樣本規模為n,應答單位數為,無應答單位數為,則調查應答率為:kn。但是,在調查執行中,如果用替換樣本進行無應答替換,就會使應答率的計算相對復雜,因為這時需要將應答單位和無應答單位區分為初始和替換兩種類型。設樣本規模為n,初
4、始應答單位數為a,初始無應答單位數為b,則初始調查應答率為:kan。不難看出,在用替換樣本進行無應答替換的調查中,如果調查執行者保留了對初始應答單位的記錄,則初始應答率的計算與對無應答單位不替換時的應答率計算并無差異。不過,與對無應答單位不做替換相比,在無應答替換的情況下,由于調查執行者在完成了初始調查后,要用替換樣本進行無應答替換,將會出現一些不替換無應答單位時所沒有的問題。第一,無應答替換的替換率問題。在進行無應答替換時,既可以替換一部分無應答單位,也可以替換所有無應答單位。從目前國內調查實踐看,經常是100全部替換,也就是說,如果初始應答單位數為a,初始無應答單位數是b,最終完成的總應答
5、單位數應該是ab;第二,無應答反復出現及多輪替換問題。既然在初始樣本中有無應答發生,那么在用替換樣本進行無應答替換時,也有可能產生新的無應答,于是就會出現多輪替換,最終使無應答單位數大于b。設用替換樣本進行無應答替換時新的無應答單位數為d,則最終總的無應答單位數應為bd。第三,初始樣本與替換樣本應答率的一致性問題。除非替換樣本特征與初始樣本特征基本保持一致,否則兩者的應答率可能在數值上存在差異。因此,只有假設用替換樣本進行無應答替換時應答率保持不變,才可以用初始應答率來代表調查應答率。從目前國內調查實踐看,相當多的調查對無應答單位采用了替換處理,但是,在這些對無應答單位進行替換處理的調查中,有
6、一些并未全面保留有關初始應答單位的替換記錄。許多調查在公布執行參數時,只是給出了樣本規模和回收的有效個案(問卷)數。一般說來,所謂回收的有效個案(問卷)數是指剔除了那些填答不全或明顯亂填的廢卷后所剩下的個案(問卷)數,通常是在實地抽樣及訪談結束后的數據清理階段,通過清理和分析問卷得出的;因為,如果在調查執行中,發現有不合格的問卷,會及時糾正或進行替換補充,不會影響樣本替換。因此,在100無應答替換的前提下,僅從數值上看,最終應答單位數通常等于樣本規模;而且,如果調查執行過程中比較嚴格地執行了問卷審查程序,有效個案(問卷)數也會很接近樣本規模。另外,如果缺少全面的替換記錄,也可能無法確定廢卷究竟
7、屬于初始樣本還是替換樣本。也就是說,樣本規模、最終應答單位數和有效個案(問卷)數三者雖然數值比較接近,但概念上是不同的,是不能相互混淆的。2應答率的事后估算方法如上所述,在沒有保留全部替換資料的情況下,無法獲得相應的初始應答單位數a(或初始無應答單位數b),這時僅憑樣本規模、最終應答單位數和有效個案(問卷)數是無法計算初始應答率的。但是,從當前調查實踐看,如果保留了實際接觸的住戶數和訪談成功數,可以嘗試采用事后估算方法來計算應答率。 下面通過一個調查執行的實際例子來說明如何事后估算應答率。表1是一項當面訪談調查執行過程中,要求調查員現場填寫的訪談不成功情況記錄表。通過分析訪談不成功情況記錄表的
8、內容,發現根據抽樣地址是否是居民住戶,以及抽樣地址狀態是否明確,可以將9種訪談不成功類型進一步歸并為3種類型:(1)抽樣地址為“非住戶”(1號);(2)抽樣地址為“住戶狀況未知”(2、3、4號);(3)抽樣地址為“住戶”(5、6、7、8號)。其中“住戶”不成功情況,又可進一步分為拒訪、無法聯系和問題戶(語言、聽力、疾病等問題)等三種情況。從調查執行的過程看,所謂“非住戶”是指抽樣中抽到的是非居民戶、空戶,即此時不存在“應答”之人。由于“應答”關注的是調查員與被調查者的應答過程,是以確有被調查者存在為前提的,所以“非住戶”自然也就不應再記入應答率的計算之中,而是應將其記入抽樣誤差的計算之中。相反
9、,“住戶狀況未知”、“拒訪”、“無法聯系”和“問題戶”則是被調查者存在或可能存在的情況,因此在計算應答率時是需要考慮的。如果將應答率界定為已經完成的合格調查樣本單位數(簡記為“訪談數”)除以住戶數,那么由于調查執行中存在著“住戶狀況未知”的情況,因此,應答率實際上存在著一個值域區間(扎如,布萊爾,20072005,第216頁)。應答率值域區間的上、下限計算公式分別為:應答率區間上限訪談數住戶數下限訪談數(訪談數拒訪數無聯系數問題戶數)(1)應答率區間下限訪談數住戶數上限訪談數(住戶數下限住戶狀況未知中的住戶數)訪談數(住戶數下限住戶狀況未知數住戶比例)訪談數住戶數下限住戶狀況未知數住戶數下限(
10、住戶數下限非住戶)(2)基于同樣的考慮,如果將公式(1)、(2)中的訪談數換成拒訪數、無聯系數或問題戶數,就可以相應地獲得拒訪率、無聯系率、問題戶率值域區間的上、下限。除了應答率,在調查執行中,合作率也是需要報告的質量評估指標,它是接受調查的樣本單位數與接受調查樣本單位數和拒絕調查的樣本單位數之和的百分比,表示調查在那些實際已經聯系上了,且戶內有合格的被調查人的戶中完成的好壞(扎如,布萊爾,20072005,第166,216頁)。在操作層次上,它與應答率區間上限值的區別在于分母不包括問題戶。合作率的計算公式為:合作率訪談數符合調查要求的住戶數訪談數(訪談拒訪無聯系)(3)可以證明在無應答替換中
11、,如果應答率保持不變的假設條件成立,那么按事后估算公式計算出的應答率估算值,在數值上與初始應答率是相等的。下面具體給出證明過程:設樣本規模為n,初始應答單位數為a,初始無應答單位數為b。假設無應答單位全都被替換,即100替換,則最終應答單位數為ab;進一步假設無應答單位由多輪替換完成,最終發生的無應答替換單位數為c,則實際發生的訪談數為ac,按事后估算公式,應答率的估算值為。如果假設在無應答替換中,應答率保持不變,即在每輪替換中,應答率都等于初始應答率an,則ac實際上是一個無窮遞減等比級數之和,其數值為,代入估算公式后,可得:由此可見,如果假設每一輪替換時的應答率都保持初始應答率不變,按事后
12、估算公式計算出的估算值,在數值上等于初始應答率。綜上所述,在進行無應答替換的調查中,原則上應在全面保留替換記錄的基礎上,計算出初始應答率,并在確保替換樣本與初始樣本相似,或應答率保持不變的前提下,以初始應答率代表調查應答率。另外,也可以利用實際發生的訪談數量和最終應答單位數計算出的估算值,對替換樣本與初始樣本間的相似性做出檢驗;如果估算值與初始應答率相差不大,說明替換樣本與初始樣本間相差不大,反之亦然。但如果沒有全面保留替換記錄,則在使用估算值來代表調查應答率時,就需要特別謹慎地進行無應答替換,以確保替換樣本與初始樣本間的相似性。不難看出,在用替換樣本進行無應答替換的調查中,選取適當的樣本替換
13、方法也是計算調查應答率需要特別關注的一環。3無應答替換方法在抽樣調查中,常用的單位無應答替換方法包括一下幾類:明顯替換、補充抽樣和二重抽樣等。首先,“明顯替換”是采用總體中的其他單位(元素)來替換樣本中的無應答單位,目的是使最終的應答數量不低于樣本規模,即抽樣設計要求的樣本的個數。這種替換方法的一個明顯特征就是要求替換樣本單位不屬于初始抽樣單位,故也稱之為“冷”替換。替換樣本的抽取既可以用隨機方法,也可用非隨機方法。隨機方法就是按概率抽樣方法,從初始樣本以外的總體的其他單位中隨機抽取替換樣本。在隨機抽取替換樣本時,應特別注意分層原則,即盡可能地在那些與無應答單位同屬一個層的總體單位中抽取替換樣
14、本。這樣做的一個重要原因是希望盡可能降低有意識無應答單位數量,進而降低產生估計偏倚的可能性。與隨機方法不同,非隨機方法是按照一些預先制定的規則,從總體中初始樣本以外的其他單位中選取替換樣本。在入戶調查訪問中,無應答住戶的替換單位經常被規定為該住戶的前(或后)一個住戶;而在電話調查中,經常將無應答單位的電話號碼尾數加1后作為替換單位的電話號碼。與非隨機方法相比,隨機方法由于能夠估計抽樣誤差,故具有能夠對統計值進行統計評價的優點。其次,“補充抽樣”是在對應答率進行估計的基礎上,采用與抽取初始樣本同樣的方法獨立地抽取數組替換樣本,在執行調查過程中,不斷地補充加入,直到最終應答單位數量達到樣本規模為止
15、。第三,“二重抽樣”是指對初始無應答單位再進行一次隨機抽樣,然后對被抽中的無應答單位的第二重樣本再次進行調查,最終利用第一重樣本和第二重樣本的應答數據來估計總體參數。這種方法與前兩種方法不同,它并不對無應答單位進行100的替換,而是進行部分替換。同時用來替換的替換樣本也不是出自總體中第一重樣本以外的單位,而是對那些初始無應答單位再進行一次隨機抽樣,獲得一個第二重樣本。該方法的操作步驟如下:首先,從總體中抽取一個規模較大的第一重樣本,采用費用較低的調查方法(通常為郵寄問卷調查)對其進行調查,獲得初步數據,這時一般會出現較高的無應答率。接下來,對這些無應答單位再進行一次隨機抽樣,獲得一個規模較小的
16、第二重樣本,并采用當面調查的方式,派調查員對這個較小的第二重樣本進行細致的調查,力求在較高應答率的情況下獲得應答數據。最后將第一重樣本的應答數據和第二重樣本的應答數據結合起來,對總體參數做出估計。需要說明是“二重抽樣”方法產生了一種事后分層效果。通過第一重抽樣得到了樣本規模為的樣本,而通過費用較低的調查方法(如郵寄問卷),則將樣本分成“應答”和“無應答”兩個層,同時一方面得到了兩個層的權重估計值,另一方面也得到了應答層的觀測值。接著再通過第二重抽樣和當面調查方式,進一步獲得了無應答層的觀測值。由于進行了分層處理,故能夠對總體參數做出比較精確的估計。采用“二重抽樣”方法還要考慮二重抽樣的最優配置
17、,即在調查經費一定的前提下,合理配置第一重抽樣規模和第二重抽樣的抽樣比,具體計算公式如下:其中,最終要求出的三個量分別是:總的調查經費C;第一重抽樣的樣本規模n;從無應答單位中進行二重抽樣的抽樣比f(K1fm稱為擴張系數,m為二重抽樣的樣本規模)。另外,是第一重樣本每個單元的調查費用(如郵寄一份問卷的費用),是處理第一重樣本每個回答單元的費用(如每份回答問卷的數據處理費用),是無應答單元第二重樣本每個單元的調查和數據處理費用(如每份當面訪問問卷的調查與數據處理費用),計算時這些費用都是事先給定的。、分別是第一重抽樣的應答和無應答單位數量,、分別是應答率和無應答率,計算時(或)是預先給定的。是假
18、設所抽取的第一重樣本如果得到全部回答時其均值的方差,為該假設狀態下的樣本規模,計算時是預先給定的,為總體方差。例如,欲進行一次北京城8區范圍的抽樣調查,在沒有無應答的假設條件下,按研究精度要求需要抽取1000人,為計算方便,這里采用簡單隨機抽樣方法。由于實際調查中存在著大約30的無應答率(),故希望采用“二重抽樣”方法來處理無應答樣本單位。設郵寄一份問卷的費用為2元(包括郵寄費和問卷印刷費),一份完成的郵寄問卷的數據處理費用為20元;當面訪問中完成一份問卷時的調查員勞務和數據處理費用合計為100元。這時假設無應答層方差和總體方差相等,可按上述公式進行如下計算:即需要事先寄出n1328份問卷,預
19、計會有13280.3398名被訪者無應答,需要從中抽出190名,派出調查員進行當面訪問。郵寄問卷和當面訪問總的調查費用為:4結語通過以上分析不難看出,在對無應答單位進行替換的調查中。計算應答率時必須考慮無應答替換的影響,而實現這一點的條件是全面保留無應答替換的相關資料。從目前國內由研究者自行主持的調查實踐看,一些調查并未做到全面保留無應答替換的相關資料,以至于無法準確計算出調查應答率。希望此番有關應答率計算的討論,能使眾人對無應答替換現象引起足夠的重視,在今后的調查中,制定出保留調查執行資料的程序,嚴格執行之。其次,有關無應答替換的討論,還提示我們關注無應答現象產生偏差的可能性。在目前大多數調查中,“明顯替換”是經常被采用的替換方法。由于替換無應答單位的替換樣本是從總體中獨立抽取來的,因此,在每一輪無應答替換中,總是用那些“應答單位”來代替那些“無應答單位”。此時,如果調查中的“應答單位”和“無應答單位”在樣本特征上存在著實質性的差異,那我們極有可能漏掉那些特征不同的“無應答單位”的答案,使參數估計出現偏差,特別是當無應答單位比例較高時更是如此。如何走出用“應答單位”替換“無應答單位”的困境,降低偏差出現的可能性,則是“二重抽樣”和其他缺失值處理方案的努力方向。最后,任何討論抽樣的文章都應該強調:社會調查應答率是由多種因素決定的,其中有宏觀社
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京審計大學金審學院《醫藥市場營銷學(英)》2023-2024學年第一學期期末試卷
- DB4228T 70-2021 馬鈴薯品種硒富集能力篩選技術規程
- DB4212T 35-2020 沿江防護林建設技術規程
- 桐城師范高等專科學校《海洋生化工程概論》2023-2024學年第一學期期末試卷
- 閩西職業技術學院《中醫內科學(實驗)》2023-2024學年第一學期期末試卷
- 山西財經大學《心理咨詢技術實操》2023-2024學年第一學期期末試卷
- 鄭州電子信息職業技術學院《黔東南紅色文化研究》2023-2024學年第一學期期末試卷
- 長沙南方職業學院《韓語強化》2023-2024學年第一學期期末試卷
- 2025至2030商業地產項目發展趨勢分析與未來投資戰略咨詢研究報告
- 房屋工程的裂縫處理加固方案
- 學校教學設備設施安全管理制度(3篇)
- 森林消防專業實習總結范文
- DB32T 2677-2014 公路涉路工程安全影響評價報告編制標準
- 軟件正版化培訓
- 《電力電子技術(第二版) 》 課件 項目五 交流調壓電路-調試電風扇無級調速器
- 無人駕駛汽車路測與數據收集服務合同
- 【碳足跡報告】新鄉市錦源化工對位脂產品碳足跡報告
- 部編版七年級下冊歷史期末復習開卷考試知識點速查提綱
- 《ESPEN重癥病人營養指南(2023版)》解讀課件
- 華夏航空在線測評題
- 海南省海口市(2024年-2025年小學四年級語文)人教版期末考試((上下)學期)試卷及答案
評論
0/150
提交評論