




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章 調研樣本設計1 抽樣的概念和類型2 非概率抽樣方法3 概率抽樣的原理與程序4 概率抽樣方法5 抽樣誤差和樣本規模總統大選預測失敗 1936年美國總統大選前,文學文摘雜志寄出1000萬張詢問投票傾向的明信片,然后依據收回的240萬份調查結果極其自信地預測共和黨候選人蘭登將以領先15%的得票率戰勝民主黨候選人羅斯福而當選總統。然而,選舉結果使預測者們大失所望:獲勝者不是蘭登,而是羅斯福,并且其得票率反超過蘭登文學文摘雜志也因此而關了門。 是什么原因導致文學文摘預測失敗呢?除了郵寄方式上的原因外,對抽樣的總體缺乏認識和明確界定也是極為重要的原因。因為它當時抽樣所依據的并不是美國全體已登記的選
2、民名單,而是以電話號碼簿和俱樂部會員作為調查對象。對象明確,才能有的放矢,取得真實、可靠、全面的信息資料。只有明確調查總體,才能從中進行正確的抽樣,并保證抽樣的樣本符合要求。普查逐一調查總體的每一個單位的信息,加以匯總,得到調查對象特征的調查方法。抽樣調查一種專門組織的非全面調查,它是按照一定的方式,從調研總體中抽選出一部分單位作為樣本進行調查,并根據所得的結果推斷總體情況和特征的一種專門性的調查活動。第一節 樣本和抽樣的基本概念一、調查總體與抽樣總體調查總體所有調查研究的對象的全體。抽樣總體(樣本)由抽樣調查時被抽取的調查對象所構成的集合。二、總體單位和樣本單位總體單位構成總體的每一個單位。
3、樣本單位抽樣調查時被抽中的總體單位。 三、總體指標與樣本指標總體指標(參數值)根據總體各個單位標志值計算出來的綜合指標。樣本指標(統計值)根據各樣本單位標志值計算出來的綜合指標。四、抽樣框及抽樣框的選擇抽樣框所有總體單位的集合,是總體的數據目錄或全部總體單位的名單。1、包含盡可能多的樣本單位2、所有單位出現的概率相同五、調查誤差與抽樣誤差 調查誤差調查的結果和客觀實際情況之間的偏離。一般以工作性誤差和代表性誤差存在。工作性誤差在市場調查工作過程中由于調查方案的缺陷、調查方法不科學、調查人員不誠實或者由于抄寫、記錄、登記、計算等工作上的失誤而導致的誤差。代表性誤差用樣本代表總體,推斷總體時產生的
4、誤差。又可分為系統性偏差和抽樣誤差兩種。 系統性偏差由于調查者違背抽樣的隨機原則,人為的選擇偏高或偏低單位進行調查時產生的誤差。抽樣誤差按照隨機原則抽樣時,所得樣本指標與總體指標的實際差數。影響抽樣誤差大小的因素:1、被研究總體各單位標志值的差異程度2、抽取的調查個體數目3、抽樣調查的組織方式。第二節 抽樣調查的特點及程序一、抽樣調查的特點1、費用低,容易推廣2、質量高,可信度好建立在科學的數理統計分析的基礎上3、時間短,收效快2022-3-23抽樣與全面調查u全面調查被定義為對整個同質總體中每個成員的報告,全面調查的最好例子也許是全國人口全面調查。比較項目 適用條件抽樣調查全面調查投入費用小
5、大可用時間短長總體規模大小特征差異小大抽樣誤差的成本低高非抽樣誤差的成本高低對個體的關注是否二、抽樣調查的適用情況1、用于認識那些不能或難以采用全面調查的總體的數量特征。2、用于認識不適宜進行全面調查,但又必須了解總體數量特征的事物。3、用于認識不必進行全面調查的總體。4、用于搜集靈敏度高、時效性強或時間要求緊迫的信息資料。5、在核對和補充普查準確性時采用抽樣調查。三、抽樣調查程序(一)界定調查總體及樣本單位 在這個步驟中最重要的是,總體必須得到正確而且精確的定義,因為如果總體定義錯誤可能會導致整個市場研究項目的失敗。調查總體可以從以下一個方面描述:地域特征、人口統計特征、產品或服務的使用情況
6、、產品或服務的認知度。(二)選擇資料收集方法(三)選擇抽樣框評估抽樣框誤差的關鍵在于: 判斷列人抽樣框中的人與總體的差異程度; 估計總體中哪幾類人未列入抽樣框中。選擇抽樣框的標準是:關聯率較高,未列入抽樣框中的總體成員對抽樣結果影響不大。 (四)選擇抽樣方法1、隨機抽樣方法優點:排除了人為的干擾,抽取的樣本可以大致上代表總體;能夠計算調查結果的可靠程度。缺點:(1)對所有調查樣本都給予平等看待,難以體現重點;(2)抽樣范圍比較廣,所需時間長,參加調查的人員和費用多(3)需要具有一定專業技術的專業人員進行抽樣和資料分析,一般調查人員難以勝任。2、非隨機抽樣方法優點:1)可以充分利用已知資料,選擇
7、較為典型的樣本,使樣本更好的代表總體。2)可以縮小抽樣范圍,節約調查時間、調查人員和調查費用。3)操作方便,易于實施,統計上也很簡單缺點:1)無法判斷其誤差和檢查調查結果的準確性。2)有目的的非隨機抽樣可能會導致系統的排除或過分強調研究對象的個性特征,評估非隨機抽樣的總體質量有很大困難。選擇抽樣方法時,可以考慮的因素:1)如果調研人員在最后使用各種統計學的方法分析與處理調研數據(隨機)。2) 調研結果要具有一定的準確性和把握性(隨機)3)抽樣框(隨機)4)如果沒有掌握隨機抽樣的原理,或調研頻度比較大(非隨機)(五)確定樣本容量(六)制定抽取樣本的操作程序第三節 隨機抽樣方法及其應用一、簡單隨機
8、抽樣simple random sampling(一)從含有N個元素的總體中直接隨機抽取n個元素組成樣本,類似于抽簽。這種方法一般適用于調查研究總體中各個體之間差異程度較小的情況,或者調查對象不明,難以分組、分類的情況。(二)方法A 總體元素較少時,類似于抽簽方法。B 總體元素較多時,隨機數表法簡單隨機抽樣的局限:1、該法需以一個完整的總體單位表為依據,但是在現實中編制這樣一個完整的總體單位表是極其困難的2、這一方法要求對所有研究對象編碼,當研究對象較多時,這一工作非常復雜3、精度往往較低,標準差較大4、該法抽出的樣本是否能代表目標總體值得商酌二、系統抽樣/等距/機械抽樣(一)含義(一)含義:
9、把總體的單位進行編號排序后,再計算出某種間隔,然后按這一固定的間隔抽取個體的號碼組成樣本的方法。(二)具體步驟(二)具體步驟:1.先按一定標志把總體中的個體順序排列,排列所依的標志有兩種。2.計算抽樣間距K,并在間隔的基礎上選擇樣本N N(總體規模)n n(樣本規模)K=K=3.在頭K個個體中隨機確定起點(A) e.g.e.g.如果如果K=10K=10,就從,就從01-1001-10號中抽簽決定號中抽簽決定一個號碼作為起點,假定為一個號碼作為起點,假定為05054.從A開始,每隔K個個體抽取一個個體,組成樣本: A,A+K,A+2K.,A+(n-1)K 05,15,25,.,950010110
10、21031091002012022032092003013023033093004014024034094005015025035095006016026.096007017027097008018028098009019029099010020030100系統抽樣比簡單隨機抽樣簡單、經濟。但是(1)運用系統抽樣的前提時要具有調研總體的每個個體的有關資料(2)可能會出現系統誤差,因為調查對象的變動可能會帶有某種規律,即一定數量間隔發生周期性變化,而此時抽樣間隔又與這類周期性間隔相似。(一)含義:先將總體中所有單位按某種特征或標志劃分為若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系
11、統抽樣的方法抽取一個子樣本,將其合成樣本。 分類分類隨機隨機抽樣抽樣總體樣本三、分層抽樣/類型抽樣子群(一)分層比例抽樣 即分層抽出的樣本按各層總單位數占整個總體的比例來確定。 例如:某地區有百貨商店1000個,其中大型百貨商店100個,中型百貨商店300個,小型百貨商店600個,如果總樣本數定為20個,則各層應抽取的樣本數是多少?nNNnii樣本容量(二)分層最優抽樣 根據各層樣本標準差的大小,調整各層樣本數的抽樣方法。當各層單位之間的差異過大,而某些層的重要性又遠大于其他層時,就需要采用非比例抽樣。表示各層樣本標準差表示樣本總數,代表各層總單位數,代表各層樣本單位數,樣本數目iiiiiii
12、iSnNnSNSNnn,例如:某市有居民100萬戶,計劃抽取樣本1000個。家庭收入按高、中、低分層,其中高收入為15萬戶,中收入為65萬戶,低收入為20萬戶,假設各層樣本標準差分別為300,200,50,則各層應抽取樣本數為多少?分層抽樣的應用程序:1、找出突出的與所研究的行為相關的人口統計特征和分類特征。2、按照所選定的特征把總體各單位分成兩個或兩個以上的相互獨立的完全的層3、在每個層中進行簡單隨機抽樣4、各層中抽出的子樣本共同構成調查樣本分層抽樣的優點:精確,在對總體進行推斷時,還能獲得對每層的推斷。缺點:有時劃分層并不容易;分層抽樣要求各層的大小都是已知的,當它們不能精確得知時,還需要
13、通過別的手段進行估計。適用情況:1)即要估計總體參數,又要估計各層參數2)要保證樣本更具代表性3)為使調查的組織及數據的匯總都比較方便四、整群抽樣cluster sampling(一)含義(一)含義:當總體的所在基本單位自然組合為或被劃分為若干個群后,從中隨機抽取部分群并對群內全部或部分單位進行調查的一種抽樣組合方法。 劃分劃分子群子群隨機隨機抽樣抽樣由于抽選單位集中,整群抽樣的抽樣誤差較大,代表現較低在大規模市場調研中,當群體內各個體間差異較大,而各群之間差異較小時,最合適采用分群抽樣方式。盡管整群抽樣效果一般較差,但是應用也很廣泛,主要因為1)當缺少基本單位的名單而難以直接從總體中抽取所要
14、調查的基本單位,但是由基本單位組成的群體具有現成的名單2)即使容易獲得個體的抽樣框,但從費用上考慮,直接從個體抽樣獲得的樣本可能比較分散,從而將增加費用、時間,但是按群抽樣,樣本比較集中,方便、節省費用。3)采用整群抽樣是抽樣調查本身目的的需要(普查后的抽樣復查)4)在某些總體的各個子總體之間差異不大時,采用整群抽樣的精度不比直接從總體中抽取樣本的精度低。整群抽樣與分層抽樣的區別:1)分層抽樣的樣本是從每個子集中抽取的,而整群抽樣只是對部分子集進行抽取2)分層抽樣是按照與調查所關心的總體特征相關的標志對總體進行分層,而整群抽樣往往是按照總體單位自然形成的分組特征進行分群的3)整群抽樣的誤差取決
15、于群間差異,而不受群內單位之間差異的影響,這就要求由總體基本單位所形成的各個群盡量有相同或相近的群內結構,而與分層抽樣的“層內差異盡量小,層間差異盡量大”相對比。某市有300所小學,共240000名學生。這些小學分布在全市5個行政區中。重點小學有30所,一般小學有240所,較差的小學有30所。現在要從全市小學生中抽取1200名學生進行調查,以了解全市小學生的學習情況。請設計一種抽樣方案。5、多階段抽樣 多階段抽樣,也稱為多級抽樣、多階抽樣、套抽樣,是指在抽取樣本時,分為兩個及兩個以上的階段從總體中抽取樣本的一種抽樣調查方法。多階段抽樣的應用 當我們面對的總體單元數很龐大,而且分布范圍很廣時,如
16、果使用前面所學習的單階抽樣方法,不僅工作量大,而且在精度上很難把握,此時如果改用多階段抽樣方法,就會避免上述困難,從而達到理想的抽樣效果。 多階段抽樣具體操作過程是: 第一階段,將總體分為若干個一級抽樣單位,從中抽選若干個一級抽樣單位入樣; 第二階段,將入樣的每個一級單位分成若干個二級抽樣單位,從入樣的每個一級單位中各抽選若干個二級抽樣單位入樣,依此類推,直到獲得最終樣本。 多階抽樣與分層抽樣和整群抽樣的關系 優點在于適用于抽樣調查的面特別廣,沒有一個包括所有總體單位的抽樣框,或總體范圍太大,無法直接抽取樣本等情況,可以相對節省調查費用。其主要缺點是抽樣時較為麻煩,而且從樣本對總體的估計比較復
17、雜。 一、分層抽樣是對總體中的每個一級樣本群體進行全面入樣,再對所有的樣本進行抽查;而兩階抽樣則把總體中所有的群體視為一階單元,對這些一階單元進行抽樣,將抽出的樣本再次進行抽樣(兩次都不是進行全面的調查),產生兩級樣本,最后綜合估算出總的一級樣本指標。 二、整群抽樣是對總體中抽取的每個樣本群體所包含的基本單元進行全面調查;而兩階抽樣則把總體中所有的群體視為一階單元,對每一個被抽中的一階單元所包含的二級單元(即基本單位),不是進行全面的調查,而是再進行一次抽樣調查(也稱抽子樣本)。多階段抽樣的特征 :(一) 便于組織抽樣。 (二)抽樣方式靈活,有利于提高抽樣的估計效率。 (三)多階段抽樣對基本調
18、查單元的抽選不是一步到位的(四)多階段抽樣實質上是分層抽樣與整群抽樣的有機結合。 (五)多階段抽樣在抽樣時并不需要二階或更低階單元的抽樣框。 (六)多階段抽樣還可用于“散料”的抽樣,即散料抽樣。 第四節 非概率抽樣方法非概率抽樣:依據研究者的主觀意愿、判斷或是否方便等因素來抽取對象的方法。適用原因:1、受客觀條件限制無法進行嚴格的隨機抽樣2、為了快速獲得調查結果3、調查對象不確定4、總體各單位間離散程度不大,且調查員具有豐富經驗一、便利抽樣(方便抽樣、偶遇抽樣)根據調查者方便與否來抽取樣本的一種抽樣方法。優點:調查條件要求低,簡便易行,省時、省力、成本比較低。缺點:不是概率抽樣,不能推斷總體
19、適用于非正式的探索性調查,只有在調查總體各單位之間差異不大時,抽取的樣本才有較高的代表性。思考:便利抽樣是不是意味著對受訪對象不加控制?思考:大的樣本,即使是方便抽樣得來的,也是有代表性的? 二、判斷抽樣(目的抽樣)一種憑借研究人員的主觀意愿、經驗和知識,從總體中選擇具有典型代表性的樣本作為調查對象的抽樣方法。前提:研究者必須對總體的有關特征有相當程度的了解。判斷抽樣選取樣本單位一般有兩種做法:1、選擇最能代表普遍情況的調查對象,常以“平均型”或“多數型”為標準2、利用調查總體的全面資料,按照一定的標準,主觀選取樣本。適用:商業領域的市場調研中,特別是樣本量小及樣本不易分門別類挑選時。(新產品
20、的市場潛力選定市場,新促銷方法選定百貨商店)三、配額抽樣首先將總體中的所有單位按一定的標志分為若干層(組),然后在每個層(組)中按一定比例用便利抽樣或判斷抽樣的方法選取樣本單位。思考:配額抽樣與分層抽樣的異同點?1.目的不同:配額抽樣要保證樣本與總體在結構比例表面上一致;分層抽樣則要提高各層間的異質性與同層中的同質性,而且也為了照顧比例小的層次。2.方法不同:配額抽樣中各層樣本是非隨機抽取的;而分層抽樣中各層樣本是隨機抽取的。按照配額的要求不同,配額抽樣可分為獨立控制配額抽樣和交叉控制配額抽樣。1、獨立控制配額抽樣根據調查總體的不同特征,對具有某個特征的調查樣本分別規定單獨分配數額,而不規定必
21、須同時具有兩種或兩種以上特征的樣本數額。例如:進行空調的消費需求調查,確定200個樣本,選擇消費者的收入、年齡、性別三個標準,采用獨立控制配額抽樣月收入月收入 人數人數年齡年齡 人數人數 性別性別 人數人數800元以下 208002000元 5020003500元 703500元以上 60合計 200 30歲以下 403040歲 604050歲 7050歲以上 30合計 200 男 100女 100合計 2002、交叉控制配額抽樣對調查對象的各個特征的樣本數額交叉分配。我們仍以上為例子,必須對收入、年齡、性別同時規定分配數額對每一控制特征所需分配的樣本都做了具體規定。800元以下元以下8002
22、000200035003500元以上元以上合計合計男 女男 女男 女男 女30歲以下3040歲4050歲50歲以上合計2 23 33 32 210 105 520 63 42 530 207 710 1612 78 337 336 61 125 134 436 2440607030200四、雪球抽樣snowball一種在稀疏總體中尋找受訪者的抽樣方法。做法:先設法找到一名符合條件的受訪者,在對其進行訪問后,再請其推薦或介紹其他符合條件的人。大大增加接觸總體中所需群體的可能性,有針對性的找到被調查者,降低了調查費用。但要求樣本單位之間有一定聯系第五節 抽樣誤差和樣本規模抽樣誤差 抽樣誤差是指由于
23、隨機抽樣的偶然因素使樣本各單位的結構對總體各單位結構的代表性差別,而引起的抽樣指標和全及指標之間的絕對偏差。如抽樣平均數與總體平均數的偏差,抽樣成數與總體成數的偏差等等。 影響抽樣誤差大小的因素主要有:(1)總體單位的標志值的差異程度。 差異程度愈大則抽樣誤差愈大,反之則愈小。(2)樣本單位數的多少。 在其他條件相同的情況下,樣本單位數愈多,則抽樣誤差愈小。(3)抽樣方法。 抽樣方法不同,抽樣誤差也不相同。一般說,重復抽樣比不重復抽樣,誤差要大些。(4)抽樣調查的組織形式。 抽樣調查的組織形式不同,其抽樣誤差也不相同,而且同一組織形式的合理程度也會影響抽樣誤差。抽樣平均誤差 抽樣平均誤差是抽樣平均數(或抽樣成數)的標準差。它反映抽樣平均數(或抽樣成數)與總體平均數(或總體成數)的平均誤差程度。 從同一總體中,按隨機原則抽取同樣單位數的多個樣本,每個樣本可以計算各樣本平均數(或抽樣成數), 將一系列抽樣平均數(或抽樣成數)計算其抽樣平均數(或抽樣成數)的標準差, 反映抽樣平均數(或抽樣成數)與總體平均數(或總體成數)的平均誤差程度。可以根據總體方差,樣本容量(抽樣單位數目)和抽樣方式,通過一定公
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園家長學校評價反饋職責
- 2025年行政人事部崗位職責梳理年終總結及工作計劃
- 幼兒園工會職責與家長溝通機制
- 2024-2025學年度第一學期學校安全隱患排查計劃
- 學校健康觀察室疫情排查職責他
- 解放思想推動養老服務創新的個人心得體會
- 中小企業發展調研報告范文
- 2025年八年級班主任班主任自我提升計劃范文
- 消防工程確保醫療機構安全生產的技術組織措施
- 剪紙文化非遺傳承計劃
- 數字資產監管框架優化
- 醫患之間暴力行為預防與處理管理制度
- 2022年版初中物理課程標準解讀-課件
- MOOC 大學物理實驗-鄭州大學 中國大學慕課答案
- 眼科臨床路徑培訓記錄課件
- 術后病人燙傷不良事件PDCA循環分析課件
- 學校作業檢查總結匯報
- 骨科手術后的康復輔助器具和輔助裝置
- 學校課程體系建設與調整情況匯報
- 鐵路路基施工與維護習題集
- 音樂考試真題
評論
0/150
提交評論