抽樣方法課件_第1頁
抽樣方法課件_第2頁
抽樣方法課件_第3頁
抽樣方法課件_第4頁
抽樣方法課件_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、抽樣方法,1,現(xiàn)代社會(huì)調(diào)查方法,第四講 抽樣,抽樣方法,2,主要內(nèi)容,一、抽樣原理:概率與抽樣分布 二、抽樣技術(shù):概率抽樣與非概率抽樣 三、樣本規(guī)模與抽樣誤差,抽樣方法,3,回顧,何謂抽樣? 所謂抽樣,指的是從組成某個(gè)總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素(總體的一個(gè)子集)的過程,或者說,抽樣是從總體中按一定方式選擇或抽取樣本的過程。 抽樣的作用 由部分映射整體 節(jié)省時(shí)間、人力、經(jīng)費(fèi)等,抽樣方法,4,回顧,抽樣術(shù)語 總體:所有元素的集合(N) 樣本:從總體中按一定方式抽取出的一部分元素的集合(n) 抽樣單位:一次直接的抽樣所使用的基本單位(個(gè)體、群體、家庭、社區(qū)) 抽樣框:抽

2、樣范圍,總體中所有元素的名單 參數(shù)值:總體值 統(tǒng)計(jì)值:樣本值(以樣本統(tǒng)計(jì)值來推論總體參數(shù)值) 置信水平(置信度):總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間中的把握性程度(概率),反映抽樣的可靠性程度(99%、95%、90%) 置信區(qū)間:抽樣的精確性程度(區(qū)間越小,誤差越小,反之亦然),抽樣方法,5,回顧:1936年美國(guó)總統(tǒng)大選,羅斯福(民主黨),蘭登(共和黨),VS,抽樣方法,6,文學(xué)文摘雜志曾準(zhǔn)確地預(yù)測(cè)了1920、1924、1928、1932年的美國(guó)總統(tǒng)大選。 1936年,讀者文摘進(jìn)行了一次最具雄心的民意測(cè)驗(yàn)活動(dòng): 讀者文摘將選票寄給了從電話簿與車牌號(hào)登記名單中挑選出來的1000萬人。收到了220萬

3、人的回應(yīng)。 結(jié)果顯示,有57%的人支持共和黨候選人蘭登,而當(dāng)時(shí)在任的總統(tǒng)羅斯福的支持率為43%。 兩個(gè)星期后,投票結(jié)果顯示:羅斯福以歷史上最大的優(yōu)勢(shì)61%的得票率,獲得第二屆任期。相對(duì)于羅斯福的523張選票,蘭登僅得8張。 讀者文摘聲譽(yù)掃地,不久關(guān)門。,抽樣方法,7,讀者文摘為何預(yù)測(cè)失敗?,問題的癥結(jié): 回收率只有22% 抽樣框只限于電話用戶和汽車擁有者。這種設(shè)計(jì)只選擇了不成比例的富人樣本,尤其是當(dāng)時(shí)美國(guó)還處在最嚴(yán)重的經(jīng)濟(jì)蕭條后期,這個(gè)樣本排除了窮人,而幾乎所有窮人都支持羅斯福的新經(jīng)濟(jì)政策。,抽樣方法,8,抽樣誤差,抽樣方法,9,抽樣誤差,抽樣方法,10,樣本代表性與概率抽樣,概率抽樣的基本原

4、則: 如果總體中的每一個(gè)個(gè)體被抽取為樣本的概率相同,那么從這個(gè)總體中抽取的樣本就具有對(duì)該總體的代表性(即所選取的樣本能再現(xiàn)總體的結(jié)構(gòu))。 具有這一性質(zhì)的樣本通常被稱為等概率抽樣方法。 概率抽樣的兩項(xiàng)優(yōu)點(diǎn): 概率樣本更具代表性,可避免各種偏見和減少誤差 概率理論使我們能夠估計(jì)樣本的精確度和代表性 概率抽樣之所以能夠保證樣本對(duì)總體的代表性,其原理就在于它能夠很好地按總體內(nèi)在結(jié)構(gòu)中所蘊(yùn)涵的各種隨機(jī)事件的概率來構(gòu)成樣本,使樣本成為總體的縮影。,抽樣方法,11,一、抽樣原理:概率與抽樣分布,隨機(jī)抽樣:同等、獨(dú)立,抽樣方法,12,隨機(jī)事件與概率,確定性現(xiàn)象:必然發(fā)生的。 必然事件:在一定條件下必然發(fā)生的。

5、如:在一個(gè)大氣壓下,水在100攝氏度時(shí)必然沸騰。 隨機(jī)現(xiàn)象:在一定條件下可能出現(xiàn)這樣的結(jié)果,也可能出現(xiàn)那樣的結(jié)果,但究竟出現(xiàn)哪種結(jié)果事先不能肯定。 隨機(jī)事件:在一定條件下可能發(fā)生也可能不發(fā)生的事件。如拋硬幣、生小孩。 概率:事件發(fā)生頻率所接近的固定數(shù)值,它是相應(yīng)事件發(fā)生的可能性大小的一個(gè)客觀、定量的度量。,抽樣方法,13,小概率事件,抽樣方法,14,小概率事件,一個(gè)事件如果發(fā)生的概率很小的話,那么它在一次試驗(yàn)中是幾乎不可能發(fā)生的,但在多次重復(fù)試驗(yàn)中幾乎是必然發(fā)生的,數(shù)學(xué)上稱之小概率原理。 統(tǒng)計(jì)學(xué)上,把小概率事件在一次實(shí)驗(yàn)中看成是實(shí)際不可能發(fā)生的事件,一般認(rèn)為等于或小于0.01的概率為小概率。

6、墨菲定律“小概率事件必然發(fā)生”? 假設(shè)某意外事件在一次實(shí)驗(yàn)(活動(dòng))中發(fā)生的概率為p(p0),則在n次實(shí)驗(yàn)(活動(dòng))中至少有一次發(fā)生的概率為: pn1(1p)n 由此可見,無論概率p多么小(即小概率事件),當(dāng)n越來越大時(shí), pn越來越接近1。 小概率抵不過大基數(shù),抽樣方法,15,抽樣分布,擁有0-9美元的十人總體,十個(gè)人的抽樣分布,抽樣方法,16,以一個(gè)樣本的平均值來推論總體,抽樣方法,17,以兩個(gè)樣本的平均值來推論總體,抽樣方法,18,以三、四個(gè)樣本的平均值來推論總體,抽樣方法,19,以五、六個(gè)樣本的平均值來推論總體,抽樣方法,20,極限定理,極限定理:觀察次數(shù)n趨向無限時(shí)的極限行為。采用極限的

7、方法所得出的一系列定理,統(tǒng)稱極限定理。可分為兩類: 1、大數(shù)定理(大數(shù)法則或平均法則): 研究在什么條件下,隨機(jī)事件可以轉(zhuǎn)化為不可能事件或必然事件,即有關(guān)闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理。 它的意義:在隨機(jī)事件的大量重復(fù)出現(xiàn)中,往往呈現(xiàn)幾乎必然的規(guī)律。 2、中央極限定理: 研究在什么條件下,隨機(jī)變量之和的分布可以近似正態(tài)分布。 中心極限定理表明,如果一個(gè)現(xiàn)實(shí)的量是由大量獨(dú)立偶然因素的影響迭加而得,且其中每一個(gè)偶然因素的影響又是均勻地微小的,則可以斷定這個(gè)量將近似地服從正態(tài)分布。,抽樣方法,21,中心極限定理與正態(tài)分布,在自然、社會(huì)、經(jīng)濟(jì)領(lǐng)域里大量存在服從正態(tài)分布的隨機(jī)變量,如年齡、

8、身高、體重、智商等。 根據(jù)中心極限定理,均值的抽樣分布具有如下特征: 如果樣本相當(dāng)大(不少于30,最好是大于等于100),則抽樣分布接近正態(tài)分布。其特點(diǎn)是單峰和對(duì)稱,眾值、中位值與均值都相同。 抽樣分布之均值就是總體之均值()。 抽樣分布的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)誤差(SE)。 由于均值的抽樣分布是正態(tài)分布,而其面積就是均值的次數(shù),故任何兩值之間的樣本均值次數(shù)所占的比例是可以知道的。,抽樣方法,22,正態(tài)分布圖與統(tǒng)計(jì)推論,抽樣方法,23,抽樣技術(shù),非概率抽樣,概率抽樣,偶遇抽樣,判斷抽樣,配額抽樣,滾雪球抽樣,簡(jiǎn)單隨機(jī)抽樣,系統(tǒng)抽樣,分層抽樣,整群抽樣,多段抽樣,PPS抽樣,等比例,不等比例,二、抽樣

9、方法,抽樣方法,24,(一)概率抽樣 1、簡(jiǎn)單隨機(jī)抽樣,定義:簡(jiǎn)單隨機(jī)抽樣,又稱純隨機(jī)抽樣,是將總體內(nèi)所有個(gè)案都編上號(hào)碼,然后根據(jù)等概率的原則,運(yùn)用隨機(jī)數(shù)表、隨機(jī)數(shù)碼或抽簽(抓鬮)的方式從總體中直接獲取樣本。是隨機(jī)抽樣方法中最簡(jiǎn)單、最基本的方法 圖示(下頁),優(yōu)點(diǎn):在抽樣過程中完全排除了主觀因素的干擾,而且簡(jiǎn)單、易行,只要有總體各單位名單就可以進(jìn)行。 缺點(diǎn):(1)只適用于總體單位數(shù)量不多的調(diào)查對(duì)象,如果總體單位數(shù)量很大,編制抽樣框的工作就十分復(fù)雜;(2)樣本代表性較差,抽樣誤差大;(3)抽取的樣本可能比較分散或者過分集中。,抽樣方法,25,抽樣方法,26,2、系統(tǒng)抽樣,定義:又稱等距抽樣或間隔

10、抽樣。它是把總體的元素進(jìn)行編號(hào)排序后,再計(jì)算出某種間隔,然后按這一固定的間隔抽取元素來組成樣本的辦法。,優(yōu)點(diǎn):樣本在總體中的分布比較均勻,具有較高的代表性,抽樣誤差小于簡(jiǎn)單隨機(jī)抽樣,簡(jiǎn)便易行。 缺點(diǎn):(1)調(diào)查總體單位不能太多,而且要有完整的登記冊(cè);(2)注意避免抽樣間隔與調(diào)查對(duì)象的周期性節(jié)奏相重合。 反例:有關(guān)二戰(zhàn)士兵的經(jīng)典研究,抽樣方法,27,3、分層抽樣,定義:又稱類型抽樣,是先將總體中的所有元素按某種特征或標(biāo)志(如性別、年齡、職業(yè)或地域等)劃分成若干類型或?qū)哟危缓笤僭诟鱾€(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的辦法抽取一個(gè)子樣本,最后將這些子樣本合起來構(gòu)成總體的樣本。 圖示(下頁),

11、優(yōu)點(diǎn):(1)降低抽樣誤差、提高抽樣的精度;(2)便于了解總體內(nèi)不同層次的情況;(3)便于對(duì)總體中不同的層次或類別進(jìn)行單獨(dú)或比較研究。 缺點(diǎn):必須對(duì)總體各個(gè)單位的情況有較多的了解,否則就無法科學(xué)分類,而這一點(diǎn)在實(shí)際調(diào)查之前又往往難以做到。,抽樣方法,28,抽樣方法,29,繼續(xù):,實(shí)際運(yùn)用分層抽樣時(shí),需要注意的兩個(gè)方面: 一是分層的標(biāo)準(zhǔn)問題 以主要變量為準(zhǔn)(常用的變量:性別、年齡、文化程度、職業(yè)等) 組內(nèi)差異最小、組間差異最大 二是分層的比例問題 等比例 不等比例 下頁實(shí)例,抽樣方法,30,有居民20,000戶, 從中抽選200戶家庭進(jìn)行購(gòu)買力調(diào)查。其中高收入戶居民家庭為4000戶,中收入戶家庭為

12、12000戶,低收入戶家庭4000戶。又已知高收入戶的標(biāo)準(zhǔn)差為300元,中收入戶的標(biāo)準(zhǔn)差為200元, 低收入戶的標(biāo)準(zhǔn)差為100元。現(xiàn)要抽選200戶做樣本,進(jìn)行購(gòu)買力的調(diào)查 等比例分層抽樣法:從各層中分別抽取40戶、120戶、40戶家庭 不等比例分層抽樣法:從各層中分別抽取60戶、120戶、20戶家庭,抽樣方法,31,4、整群抽樣,定義:又稱聚類抽樣,是從總體中隨機(jī)抽取一些小的群體,然后由所抽出的若干個(gè)小群體內(nèi)的所有元素構(gòu)成調(diào)查樣本的方法。 圖示(下頁),優(yōu)點(diǎn):簡(jiǎn)化抽樣過程,降低調(diào)查費(fèi)用,擴(kuò)大抽樣的應(yīng)用范圍 缺點(diǎn):樣本分布面不廣,樣本對(duì)總體的代表性相對(duì)較差,抽樣方法,32,抽樣方法,33,5、多

13、段抽樣,定義:又稱多級(jí)抽樣或分段抽樣,它是按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分為幾個(gè)階段進(jìn)行。 具體做法:先從總體中隨機(jī)抽取若干大群(組),然后再?gòu)膸讉€(gè)大群(組)內(nèi)抽取幾個(gè)小群(組),這樣一層層抽下來,直到抽到最基本的抽樣元素為止。 圖示(下頁),優(yōu)點(diǎn):(1)節(jié)省人力物力和時(shí)間;(2)特別適合調(diào)查總體范圍大、單位多、情況復(fù)雜的調(diào)查對(duì)象;(3)對(duì)總體的了解要求程度低。 缺點(diǎn):抽樣誤差大,可能出現(xiàn)不等概率狀況。,抽樣方法,34,抽樣方法,35,6、PPS抽樣,定義:PPS(sampling with probability proportional to size),叫做“概率與元素的規(guī)模

14、大小成比例的抽樣”。為解決多段抽樣中的不等概率問題而設(shè)計(jì)。 具體做法:在第一階段,每個(gè)群按照其規(guī)模被給予大小不等的抽取概率(群越大,被抽中的概率越大)。但到了第二階段,從每個(gè)抽中的群中都抽取同樣多的元素。正是通過這樣兩個(gè)階段上的不等概率抽樣,使得總體中的每一個(gè)元素最終都具有同樣的被抽中的概率。,優(yōu)點(diǎn):最終抽出的樣本對(duì)總體的代表性大。 缺點(diǎn):需要知道每一個(gè)群的規(guī)模。如果無法知道其規(guī)模,就不知道其比例。 圖示(下頁),抽樣方法,36,從100家不同規(guī)模企業(yè)(共2萬名職工)中抽取1000名職工:先抽20家,再?gòu)倪@20家分別抽取50名職工。,抽樣方法,37,例1:“XX大學(xué)學(xué)生學(xué)習(xí)、生活狀況調(diào)查”抽樣

15、設(shè)計(jì),1、研究總體 XX大學(xué)全日制在校本科生、研究生。 2、抽樣方案 分層抽樣與整群抽樣相結(jié)合 (1)分層標(biāo)準(zhǔn): A 專業(yè)劃分文科類、理工類、醫(yī)學(xué)類; B 年級(jí)劃分本科四個(gè)年級(jí)、碩士研究生、博士研究生 (2)以上述專業(yè)和年級(jí)為維度進(jìn)行整群抽樣,分專業(yè)每個(gè)年級(jí)各抽取兩個(gè)班,總共抽取36個(gè)班,對(duì)抽樣班所有學(xué)生進(jìn)行調(diào)查。(詳見抽樣流程圖) (3)對(duì)有課程安排的班級(jí),我們可到教務(wù)處查詢抽中班級(jí)上課地點(diǎn)和時(shí)間,并由教務(wù)處開出介紹信預(yù)先和任課老師聯(lián)系,調(diào)查員提前15分鐘到課堂統(tǒng)一發(fā)放和回收問卷。對(duì)沒有課程安排的班級(jí),可去宿管中心查找對(duì)應(yīng)宿舍,集中時(shí)間調(diào)查。,抽樣方法,38,XX 大 學(xué),圖1 - 12 抽

16、樣流程圖,抽樣方法,39,課堂訓(xùn)練,根據(jù)以下情況設(shè)計(jì)一種抽樣方案: 某市有300所小學(xué),共240,000名學(xué)生。這些小學(xué)分布在全市5個(gè)行政區(qū)中。其中重點(diǎn)小學(xué)有30所,一般小學(xué)有240所,較差的小學(xué)有30所。現(xiàn)在要從全市小學(xué)生中抽取1200名學(xué)生進(jìn)行調(diào)查,以了解全市小學(xué)生的學(xué)習(xí)情況。請(qǐng)?jiān)O(shè)計(jì)一種抽樣方案。,抽樣方法,40,(二)非概率抽樣方法,1、偶遇抽樣 又稱方便抽樣或自然抽樣,碰到誰就選誰 不同于隨機(jī)抽樣 2、判斷抽樣 又稱立意抽樣,它是調(diào)查者根據(jù)研究的目標(biāo)和自己主觀的分析來選擇和確定調(diào)查對(duì)象的方法。 依賴于研究者的理論修養(yǎng)、實(shí)際經(jīng)驗(yàn)以及對(duì)調(diào)查對(duì)象的熟悉程度,抽樣方法,41,3、配額抽樣 進(jìn)行定額抽樣時(shí),研究者要盡可能地依據(jù)那些有可能影響研究變量的各種因素來對(duì)總體分類,并找出具有各種不同特征的成員在總體中所占的比例,然后依據(jù)這種劃分以及各類成員的比例,采用偶遇抽樣或判斷抽樣的方法去選擇調(diào)查對(duì)象。 不同于分層抽樣 4、滾雪球抽樣 滾雪球抽樣是指先隨機(jī)選擇一些被訪者并對(duì)其實(shí)施訪問,再請(qǐng)他們提供另外一些屬于所研究目標(biāo)總體的調(diào)查對(duì)象,根據(jù)所形成的線索選擇此后的調(diào)查對(duì)象。,抽樣方法,42,三、樣本規(guī)模與抽樣誤差,1、樣本規(guī)模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論