第六章 抽樣設計_第1頁
第六章 抽樣設計_第2頁
第六章 抽樣設計_第3頁
第六章 抽樣設計_第4頁
第六章 抽樣設計_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、抽樣調查的基本概念抽樣調查的基本概念 隨機抽樣技術隨機抽樣技術 非隨機抽技術非隨機抽技術 抽樣中的誤差抽樣中的誤差有關抽樣設計的幾個問題有關抽樣設計的幾個問題入戶調查中入戶調查中KISHKISH表的運用表的運用12l市場調查以抽樣調查為主。l有關抽樣調查的基本概念已在抽樣技術一課中有專門介紹,本課程不重復介紹。3l按照隨機原則抽取樣本。l樣本統計量的分布一般是可測的,可以用樣本統計量對總體參數進行估計。l技術操作相對復雜,必須有完整的抽樣框。l成本較高,對抽樣設計人員的專業技術要求較高。l詳細內容見抽樣技術。4l 非隨機抽樣是指抽樣時不遵循隨機原則,而是按照研究人員主觀判斷或僅按方便原則抽選樣

2、本。l 市場調查中常用的非隨機抽樣技術有: l方便抽樣l判斷抽樣l配額抽樣l雪球抽樣l自愿樣本5l 也稱為偶遇抽樣、隨意抽樣l 根據調查者的方便與否來抽取樣本的一種方法。最典型的方法是攔截式調查。l 操作簡便,費用節省,但樣本代表性一般較差。不能據以推斷總體。l 不適合描述性研究和因果關系研究。l 適合于探索性研究,通過調查產生想法和假設。也可用于正式調查前的預調查。6l 也稱為目的抽樣。l 研究人員憑主觀經驗,從總體中選擇具有代表性樣本進行調查。該方法的應用前提是研究者必須對總體的有關特征有相當深入的了解l 實施中有兩種方法:l 選擇最能代表普遍情況的調查對象,常以平均型或多數型為標準l 利

3、用總體全面資料,按一定標準主觀選擇樣本。(如典型單位)l 特點l 在樣本量小及樣本不能分門別類挑選時有較大的優越性l 判斷抽樣的目的多在于了解總體的數量特征和對問題的深入分析,而不是利用調查結果對總體參數進行估計。l 調查結果與研究者的判斷水平、解釋能力等相關,結果往往受到懷疑7l 先將總體分類,后在每類中用方便抽樣或判斷抽樣方法選取樣本單位。l 配額的方式有獨立控制與交叉控制兩種。獨立控制是僅按一個變量來分配樣本,交叉控制是同時按照兩個變量交叉分配樣本。l 有獨立控制配額抽樣和交叉控制配的抽樣。l 獨立控制配額抽樣只用一個變量進行配額l 交叉控制配額抽樣采用多個變量進行配額8l 獨立控制配額

4、抽樣之例:l 某項調查確定樣本量為200人,其中:男性70%,女性30%。請對抽樣進行配額。 性別性別 比例比例 人數人數 男男 70% 140 女女 30% 60 合計合計 100% 2009l 交叉控制配額抽樣之例:l 某項調查確定樣本量為200人,其中男性70%,女性30%;農村20%,城市80%。請對抽樣進行配額。性別性別男性比例男性比例(70%)男性男性人數人數女性比例女性比例(30%)女性女性人數人數地地區區農村(農村(20%) 14%28 6%12城市(城市(80%) 56%112 24%48 合計合計 70%140 30%6010l 是指先隨機選擇一些被訪者并對其實施訪問,再請

5、他們提供另外一些屬于所研究目標總體的調查對象,根據所形成的線索選擇此后的調查對象。l 雪球抽樣以若干個具有所需特征的人為最初的調查對象,然后依靠他們提供認識的合格的調查對象,再由這些人提供第三批調查對象,依次類推,樣本如同滾雪球般由小變大。滾雪球抽樣多用于總體單位的信息不足或觀察性研究的情況。這種抽樣中有些分子最后仍無法找到,有些分子被提供者漏而不提,兩者都可能造成誤差。11l 可以根據某些樣本特征對樣本進行控制,適用尋找一些在總體中十分稀少的人物。l 如果總體不大,有時用不了幾次就會接近飽和狀況,即后來訪問的人再介紹的都是已經訪問過的人。但是很可能最后仍有許多個體無法找到,還有些個體因某些原

6、因被提供者故意漏掉不提,這兩者都可能具有某些值得注意的性質,因而可能產生偏誤,不能保證代表性。l 可以根據某些樣本特征對樣本進行控制,適用尋找一些在總體中十分稀少的人物。12l 自愿樣本是由自愿接受調查的單位所組成的樣本。例如酒店房間中的顧客調查表,是由顧客自愿填答的;飛機上乘務員發放的乘客調查表,由乘客自愿參與調查。網絡調查也是自愿參與的。l 自愿樣本集中于某些特定的群體,只有能夠接觸到調查問卷的人才有機會參與調查;構成樣本的單位往往是對調查內容感興趣的那一部分。導致樣本的代表性較差。l 組織方便,成本低廉,適合于了解特定群體的意見與看法。13l 抽樣中的誤差包括抽樣誤差與非抽樣誤差。l 抽

7、樣誤差是抽樣的隨機性造成的。一般用估計量的方差 或標準差 加以描述。l 抽樣誤差是可以估計和控制的。( )V( )S14l 非抽樣誤差是指除抽樣誤差以外,其他原因引起的樣本統計量與總體真值之間的差異。l 非抽樣誤差產生的原因主要是:非抽樣誤差非抽樣誤差抽樣框誤差抽樣框誤差無回答誤差無回答誤差調查人員誤調查人員誤差差受訪者誤差受訪者誤差理解理解記憶記憶有意隱瞞有意隱瞞其他誤差其他誤差15l 抽樣精度的問題l 抽樣框誤差的問題l 樣本容量的確定問題l 抽樣方式的確定問題l 樣本輪換問題l 無回答問題l 敏感性問題16l 精度是相對的,是概率事件,沒有絕對的準確。l 一項市場調查,需了解的指標有多項

8、,故在考慮精度時,應多元化思考,對于比率值可以統一使用精度要求,對于均值則不同均值有不同精度要求。17l 總體與抽樣框之間的差異很小時,可以不考慮抽樣框誤差。l 若要處理抽樣框誤差,則可按下列辦法進行:l按現有的抽樣框重新定義總體l用加權的方法調整所搜集的資料18l在隨機抽樣中,樣本量的確定有規定的方法。l在非隨機抽樣中,樣本量一般根據經驗和調查經費的多少,主觀加以確定。l增加樣本量可以提高精度,但會增加費用。樣本量的確定要兼顧精度與費用。基本原則是,在精度一定的條件下,費用最省;或在費用一定的條件下,精度最高。19l 考慮多種因素來確定方式,可以多方式相結合。l 抽樣方式的確定,主要應該考慮

9、的因素是:l對抽樣誤差大小的要求l調查對象本身的特點l人力、物力、經費和時間要求20l 樣本老化、長期調查被調查者的合作態度受影響,長期調查可能會影響被調查者的行為,此時需要輪換樣本。l 如何輪換,輪換多少,沒有理論上的說法,主要根據經驗、需要、經費、調查的組織實施等因素主觀確定。21l 不遇被到調查者、被調查者因客觀原因無法接受調查、被調查者拒絕調查等等,都導致無回答。l 對于由于隨機因素導致的無回答,會導致估計量的方差增大。對于非隨機因素導致的無回答,既可導致估計量的方差增大,也可導致估計偏差。22l 對于無回答,可采用三種辦法處理l 分清無回答原因,有針對性地進行多次調查。l 對調查結果

10、進行估算;l 在無回答者中抽取樣本進行再調查(二重抽樣) 23l 敏感性問題是指在抽樣調查中,被調查的問題是屬于被調查人私人機密或不愿意如實回答的問題。l 如調查被調查者是否曾冒充顧客進商店行竊,是否吸毒,個人儲蓄是多少等。l 這類涉及個人隱私或違法行為的敏感性問題,若采用直接問答的方式,被調查者往往會拒絕回答或故意作出錯誤的回答。這樣就破壞了數據的真實性,而且其破壞程度的大小無法度量。24l 為了得到敏感性問題的可靠的樣本數據,則必須采用隨機化回答技術(Randomized response Technique ,簡稱RRT)。l 隨機化回答技術主要有以下特點:l 被調查者采取隨機回答的方式

11、,調查人員無法從被調查者的回答中得知對方是否具有某種特征。l 可以在一定程度上消除被調查者的顧慮,使他們參與調查,并提供真實情況。l 調查人員可以通過概率原理,運用隨機化回答結果,對總體參數進行估計。 25l 由美國統計學家沃納(Warner)在20世紀60年代中期提出的。l 其基本思想是:為了調查某個敏感性問題,同時列出兩個對立的問題,被調查者從中隨機抽出一個來回答,回答只用“是”或“否”。調查人員并不知道其回答的是哪個問題,從而保護了被調查者的個人隱私,使其有可能提供真實回答。26l 某市場工商管理部門發現個體戶中有漏稅現象,欲對個體戶漏稅人數的比例進行抽樣調查,考慮到漏稅的個體戶不愿意承

12、認自己有漏稅為,故采用隨機化回答技術。l 運用沃納隨機化回答技術的過程如下:l 制作兩疊卡片,分別為制作兩疊卡片,分別為A類卡和類卡和B類卡類卡l A卡上寫著:卡上寫著:“我有過漏稅行為我有過漏稅行為”l B卡上寫著:卡上寫著:“我沒有漏稅行為我沒有漏稅行為”l A卡和卡和B卡的數量不能相等,并混合在一起調查人員給被調查者介卡的數量不能相等,并混合在一起調查人員給被調查者介紹這種調查的目的和要求,消除被調查者的顧慮。紹這種調查的目的和要求,消除被調查者的顧慮。27l 由被調查者從盒子中隨機抽取一張卡片,并將卡片的正面對著自己,并給出“是”或“否”的回答l 調查者記錄下回答結果后,對該被調查者的

13、調查即告調查結束l 再進行下一個調查被調查者卡片A是否卡片B否是P1PA1AA1A具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 若將抽取卡片和進行回答視為兩步,可用圖示表示這個程序:29l 定義:l P:卡片A的比例l 1-p:卡片B的比例l n :樣本量l :回答“是”的人數l :回答“否”的人數l :總體中具有卡片A特征的人數的比例1nA2n30l 的估計公式l 點估計式111()()(21)21AnpPnp12p A31l 區間估計式l 的方差估計量l 區間估計式A2(1)(1)()(21)AAAppVnn

14、p()AAzV32l 例:某調查機構受市場工商管理部門的委托,采用沃納的隨機化回答模型對個體戶漏稅人數的比例進行調查,設計了兩種卡片。A卡片的比例 p=3/4, 樣本容量n=200, 調查結果回答“是”的共有120人,試用95%的置信度估計漏稅人數比例的置信區間。 33l 已知:l 解答:l 根據公式:13 / 4,200,120,1.96,pnnz111()()(21)21AnpPnp3111 2 04332 0 0221441 .20 .50 .7()()()34l 又:根據公式有:2(1)(1)()(21)AAAppVnnp233(1)0.7(10.7)443200200(21)40.0

15、01050.003750.004835l l 故總體 的置信區間為:()0.71.960.00480.71.35zVAA0 .5 6 50 .8 3 5AA36l 西蒙斯模型是1967年由西蒙斯(Simmons)提出的。l 其設計思想仍是基于沃納的隨機化回答思想,只是在設計中用無關的問題Y代替了沃納模型中的敏感性問題A的對立問題。這有助于進一步消除被調查者的顧慮。37l 例:學校有關部門要對學生期末考試中的舞弊行為進行一次調查,了解學生作弊人數的比例。l 運用西蒙斯隨機化回答技術的過程如下:l 制作兩疊卡片,分別為A類卡和B類卡l A卡上寫著:“我在考試中作弊了”l B卡上寫著:“我上星期在圖

16、書館借書了”l A卡和B卡的數量可以相等,并混合在一起l 調查人員給被調查者介紹這種調查的目的和要求,消除被調查者的顧慮。38l 由被調查者從盒子中隨機抽取一張卡片,并將卡片的正面對著自己,并給出“是”或“否”的回答。l 調查者記錄下回答結果后,對該被調查者的調查即告調查結束。l 再進行下一個調查。被調查者卡片A是否卡片B是否P1PA1AB1B具有卡片具有卡片A A特征特征 不不具有卡片具有卡片A A特征特征 具有卡片具有卡片B B特征特征 不不具有卡片具有卡片B B特征特征 若將抽取卡片和進行回答視為兩步,可用圖示表示這個程序:40l 定義:l :總體中具有卡片B特征的人數l 其他符號定義同

17、前l 的估計公式l 點估計式BA1(1)BAnpnP 41l 區間估計式l 的方差估計量l 區間估計式A1121()1AnnVnpnn ()AAzV42l 例:學校有關部門欲對學生期末考試中的作弊情況進行一次調查,采用西蒙斯隨機化回答模型。卡片A的比p=1/2,n=200,調查結果回答“是”的人數為30人。試以95%的把握程度對作弊學生的比例進行區間估計。43l 已知:l 通過查閱圖書館記錄,得知上星期中借過書的學生比例為1/4,即l 根據公式得:1,200,3021pnn1/ 4B130111200240.0512(1)BAnpnP ()44l 的方差估計量l 置信區間為: 11213030

18、10.002551200200220021()1AnnVnpnn () ()( )A()z VAA0.051.960.002550.050.09845l 要求調查人員能充分理解這種方法。l 為了進一步消除被調查者可能存在的顧慮,應當允許被調查者在正式調查前檢查卡片,了解記錄方式,使其相信這種方法不是騙人的圈套。l 如果使用西蒙斯模型,要注意選擇無關的非敏感性問題。l 該技術的實際運用尚需進一步研究。46l KISH表是指由美國著名抽樣專家KISH創立的一種在確立了戶之后,如何選擇戶內家庭成員的方法。它包括:1.家庭成員編號(最大值為8,假定家庭人口的最大數量)。2.成員名單,或者與接待者的關系

19、。3.性別。4.年齡。5.樣本戶編號。47家庭成員編號家庭成員編號姓名姓名性別性別年齡年齡 內部樣本編號(尾號)內部樣本編號(尾號) 1 12 23 34 45 56 67 78 89 9 0 01 11 11 11 11 11 11 11 11 11 11 12 21 12 21 12 21 12 21 12 21 12 23 32 23 31 12 23 31 12 23 31 12 24 43 34 41 12 23 34 41 12 23 34 45 54 45 51 12 23 34 45 51 12 23 36 65 56 61 12 23 34 45 56 61 12 27 76 67 71 12 23 34 45 56 67 71 18 87 78 81 12 23 34 45 56 67 78 8數字規律?48l確定該戶的符合調查要求的人口數;l依照年齡由高到低,按家庭成員編號的順序寫在表的相應的位置上;l確定樣本戶的編號。通常的做法是:調查員調查的第一戶的編號為1,第二戶為2,依次類推。l樣本編號所在列,與家庭成員人口數行所對應的數字為該戶成員年齡由大到小排列的編號,此編號對應的人為抽樣樣本單位。49l 某戶有5口人,年齡分別為69、67、38、32、4歲,調查要求為18歲以上,所以確定人口數為4,依照順序分別填入表中;該戶的內部樣本編號為5,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論