




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2023/7/22第七章抽樣調查1第七章抽樣調查2023/7/22第七章抽樣調查2第一節抽樣調查的概念及其分類一、幾個概念1、抽樣調查從研究的總體中按隨機原則抽取部分單位為樣本,進行觀察研究,并根據樣本的調查結果推斷總體,以達到認識總體的統計調查方法。(以很小的樣本來推斷很大的總體)2、總體N(全及總體:
Totalpopulation/Parentpopulation)(有限總體、無限總體)2023/7/22第七章抽樣調查3全及總體又稱“母體”,簡稱“總體”,是指所要認識對象的全體,總體是由具有某種共同性質的許多單位組成的,因此,總體也就是具有同一性質的許多單位的集合體。。通常全及總體的單位數用大寫的英文字母N來表示。作為全及總體,單位數N即使有限,但總是很大,大到幾千,幾萬,幾十萬,幾百萬。對無限總體的認識只能采用抽樣的方法,而對于有限總體的認識,理論上雖可以應用全面調查來搜集資料,但實際上往往由于不可能或不經濟而借助抽樣的方法以求得對有限總體的認識2023/7/22第七章抽樣調查43、樣本n(抽樣總體)(大(小)樣本)(樣本單位數達到或超過30個稱為大樣本,而在30個以下稱為小樣本)不唯一性;抽樣總體的確定原則:1)相關性是指抽樣總體與抽樣目標相關。2)完整性是指抽樣總體的內容能全面反映項目的實際情況。3)經濟性是指抽樣總體的確定應符合成本效益原則2023/7/22第七章抽樣調查54、總體指標根據總體各個單位的標志值或標志特征計算的、反映總體某種屬性的綜合指標,稱為“總體指標”。全及指標也稱為“母體參數”或“總體參數”。唯一性:由于全及總體是唯一確定的,所以總體指標也是唯一確定的。常用的總體指標有:總體平均數、總體成數、總體方差和標準方差。2023/7/22第七章抽樣調查65、樣本指標樣本指標又稱“抽樣指標”、“樣本統計量”,由樣本總體各單位標志值計算出來反映樣本特征,用來估計總體指標的綜合指標。統計量是樣本變量的函數,用來估計總體參數,因此與總體參數相對應,統計量有樣本平均數(或抽樣成數)、樣本標準差(或樣本方差)。對于一個問題總體是唯一確定的,所以總體指標也是唯一確定的,總體指標也稱為參數,它是待估計的數。而統計量則是隨機變量,它的取值隨樣本的不同而發生變化。2023/7/22第七章抽樣調查7在預測美國的總統選舉中:總體:全體合法選民樣本:部分選民推斷:根據部分對整體做出歸納指標:1、全體合法選民的平均年齡
2、當前登記投票的全體合法選民的百分比以上總體指標是不能精確測定的,僅能根據統計量和樣本指標來估計舉例:2023/7/22第七章抽樣調查8
美國1936年選舉
Roosevelt的百分比Gallup預言《摘要》的預測結果44《摘要》預測的選舉結果(240萬人)43Gallup預測的選舉結果(59萬人)56選舉結果62(注:上述百分比僅用主要政黨所得選票計算,選舉中約有2%的選票投向小黨的候選人)(由于選擇偏倚和不回答偏倚造成《摘要》的預測差錯)2023/7/22第七章抽樣調查9美國1948年的選舉候選人CrossleyGallupRoper結果Tromam45443850Dewey50505345Thurmond2253Wallace3442(由于訪問員自由挑選時無意的共和黨偏性造成預測差錯)2023/7/22第七章抽樣調查10Gallup在St.Louis定額抽樣13對象規定:6人住近郊,7人住在市中心男的7人:3人40歲以下,4人40歲以上
1名黑人,6名白人
6名白人支付的月租又做了以下的規定:
1人的支付金額不少于44.01美元
3人的支付金額在18.01-44.00美元
2人的支付金額不超過18美元女的6人2023/7/22第七章抽樣調查11Gallup民意測驗在1948年后的總統選舉中的記錄
(采用概率抽樣調查)年份樣本容量獲勝候選人Gallup民意選舉結果誤差測驗預測值19525385艾森豪威爾5155.4+4.419568144艾森豪威爾59.557.8-1.719608015肯尼迪5150.1+0.919646625約翰遜6461.3-2.719684414尼克松4343.5+0.519723689尼克松6261.8-0.219763439卡特49.551.1+1.619803500里根55.351.6-3.719843456里根59.059.2+0.219884089布什56.053.9-0.2(注:誤差=預測-實際)2023/7/22第七章抽樣調查12二、抽樣的理論依據大數定律契比雪夫定理:當樣本容量n足夠大時,獨立同分布的一系列隨機變量的算術平均數接近(依概率p收斂于)數學期望值,即隨機變量平均數具有穩定性,該定律提供了用樣本平均數估計總體平均數的理論依據。即:2023/7/22第七章抽樣調查13貝努里定理:當試驗次數n足夠大時,事件A發生的頻率接近(依概率收斂于)事件A發生的概率,即頻率具有一定的穩定性,該定理也說明,在試驗不變的條件下,重復進行很多次時,隨機事件的頻率在它的概率附近擺動。如:投硬幣即:2023/7/22第七章抽樣調查14大數定理在抽樣中的作用:A、理論基礎B、通過偶然現象揭示必然性和規律性的工具2023/7/22第七章抽樣調查15中心極限定理(獨立同分布)如果隨機變量x1,x2,….xn,獨立且服從同一分布,且存在數學期望E(xi)=X和方差D(xi)=σ2,則當樣本容量n趨于無窮大時,隨機變量均值趨于期望值為X、標準差為的正態分布,即當n→∞時,2023/7/22第七章抽樣調查16(棣莫弗-拉普拉斯)設隨機變量xn(n=1,2,…)服從二項分布B(n,p),則對于任意實數z,有2023/7/22第七章抽樣調查17中心極限定理表明,不論總體服從何種分布,只要存在數學期望和方差,從中抽取容量為n的樣本,則當n足夠大時(n>30),樣本均值趨于正態分布。2023/7/22第七章抽樣調查18大數定律與中心極限定理相同點是,都是通過極限理論來研究概率問題,研究對象都是隨機變量序列,解決的問題都是概率論中的基本問題,因而在概率論中具有重要意義;兩者不同點是,大數定律研究的是概率或平均值的極限,而中心極限定理研究的是隨機變量總和或平均值的分布極限。2023/7/22第七章抽樣調查19三、概率論2023/7/22第七章抽樣調查20
二、抽樣調查的分類概率調查簡單隨機抽樣(隨機抽樣)類型抽樣等距抽樣整群抽樣多階段抽樣
非概率調查重點抽樣典型抽樣隨意抽樣定額抽樣2023/7/22第七章抽樣調查21第二節隨機抽樣的基本原理一、樣本的可能數目1、概念2、計算方法(1)考慮順序的重復純隨機抽樣的樣本的可能數目(2)不考慮順序的不重復純隨機抽樣的樣本的可能數目(3)考慮順序的不重復(不考慮順序的重復)純隨機抽樣的樣本數目?2023/7/22第七章抽樣調查22
二、代表性平均誤差(一)幾個概念1、代表性誤差(以部分推斷總體)2、代表性平均誤差或3、極限誤差(可能誤差的范圍)極限誤差:在一定觀測條件下偶然誤差的絕對值不應超過的限值或在同一個測試條件下,按給定置信度預期達到的最大誤差。2023/7/22第七章抽樣調查23(二)平均誤差的估計1、簡單隨機抽樣平均誤差的估計(1)按重復簡單隨機抽樣方式估計平均誤差成數指標:2023/7/22第七章抽樣調查24(2)按不重復簡單隨機抽樣方式估計平均誤差成數指標:3、舉例運用P192-193.2023/7/22第七章抽樣調查25(三)影響代表性平均誤差的因素總體標志的變動程度;抽樣單位的多少;受不同抽樣方法的影響(抽樣方法:不重復抽樣的平均誤差一般會小于重復抽樣);受不同抽樣組織方式的影響。(簡單隨機抽樣。。。)2023/7/22第七章抽樣調查26第三節置信度與置信區間一、概念1、置信區間:在一定的概率保證程度下,某總體指標所在的區間范圍——區間估計。置信區間是指在某一置信水平下,樣本統計值與總體參數值間誤差范圍。置信區間越大,置信水平越高。2023/7/22第七章抽樣調查272、置信度:總體指標在某一區間內的概率保證程度,F(t)。所謂置信度,也叫置信水平。它是指特定個體對待特定命題真實性相信的程度,也就是概率。置信水平是指總體參數值落在樣本統計值某一區內的概率。2023/7/22第七章抽樣調查283、概率度t:抽樣極限誤差除以抽樣平均誤差得到的相對數.公式:或2023/7/22第七章抽樣調查29二、確定置信區間的方法1、條件:需知置信度F(t),樣本平均數或樣本成數,平均誤差估計量。2、方法:(1)由F(t)查t分布表或標準正態分布表得t值。(2)計算平均誤差估計量或。(3)計算極限誤差的值。(4)寫出置信區間并加以說明。2023/7/22第七章抽樣調查30三、確定置信度的方法1、條件:需知置信區間,樣本平均數或樣本成數,平均誤差估計量。2、方法:(1)由求出t值。(2)由t分布表或標準正態分布表得置信度F(t)。2023/7/22第七章抽樣調查31eg.某大型股份公司設有5個工資級別,該公司人員的月平均工資為5000元,標準差為1421元,(1)是否可以認為,在這5個級別的人員中,95%的人所掙工資在2215~7785元之間?為什么?(2)以下說法是否正確:如果反復地從這些級別中每次抽取100人的簡單隨機樣本,這些人的平均工資有95.45%的概率在4718~5282元之間。(3)以下說法是否正確:如果反復地從這些級別中每次抽取10000人的簡單隨機抽樣,這些人的平均工資有99.73%的概率在4718~5282元之間。2023/7/22第七章抽樣調查32解:(1)已知:下限上限則可以認為。。。!(2)(1)已知:上限下限2023/7/22第七章抽樣調查33說法是對的!(3)已知:下限上限2023/7/22第七章抽樣調查34說法是錯誤的!2023/7/22第七章抽樣調查35估計量的標準無偏性:樣本指標所有可能取值的平均數等于估計總體指標的屬性。樣本平均數是總體平均數的無偏估計樣本方差是總體方差有偏估計;但是是總體方差的無偏估計。2023/7/22第七章抽樣調查36有效性:方差最小的屬性。(兩個樣本,其中一個的方差比另一個的方差小,說明小方差的樣本更有效)一致性:樣本指標逐漸趨于總體指標的屬性。(大數定律)(P196)2023/7/22第七章抽樣調查37不同情況下總體均值的區間估計總體分布樣本量方差已知方差未知正態分布大樣本()小樣本()非正態分布大樣本()2023/7/22第七章抽樣調查38第四節隨機抽樣調查的組織形式一、隨機抽樣調查的概念及特點1、隨機抽樣的概念2、特點(1)是一種非全面調查(2)按隨機原則抽取調查單位(3)以樣本代表總體,用樣本指標去推斷總體指標。(4)抽樣調查中產生的誤差可以事先計算并加以控制2023/7/22第七章抽樣調查39二、隨機抽樣的作用1、可節省人力、物力、財力和時間2、用于不可能進行全面調查的總體數量特征的推斷3、用于某些不必要進行全面調查的總體數量特征的推斷。4、用于全面調查資料的評價和驗證。5、用于生產過程的質量控制。2023/7/22第七章抽樣調查40三、隨機抽樣的一般方式(一)簡單隨機抽樣1、概念:純隨機抽樣。2、抽選方法:直接抽選法,抽簽法,隨機數字法。3、各項指標的計算(P198)(1)總體平均數(2)總體總值(3)總體方差(4)樣本總值(5)樣本平均數(6)樣本方差2023/7/22第七章抽樣調查41(7)抽樣平均誤差(8)抽樣極限誤差(9)區間估計
(10)點估計(10)成數指標(11)樣本容量??
(P203)(12)計算(P200)2023/7/22第七章抽樣調查42抽樣的組織方式(一)簡單隨機抽樣(也叫純隨機抽樣,SPS抽樣)。
1.概念:就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調查單位。特點:每個樣本單位被抽中的概率相等,樣本的每個單位完全獨立,簡單隨機抽樣是其他各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數目較少時,才采用這種方法。
方法:將總體單位編成抽樣框,而后用抽簽或隨機數表抽取樣本單位。2023/7/22第七章抽樣調查43(二)類型抽樣1、概念:先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或其他抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本。
2023/7/22第七章抽樣調查442、類型抽樣如下圖:
3、樣本容量的確定(P203)?2023/7/22第七章抽樣調查45[例]某年級學生共180人分為四個班,其中甲班N1=40人,乙班N2=50人,丙班N3=45人,丁班N4=45人,現要抽取20%作為樣本,則每班應抽取的樣本單位數按如下步驟算出:
1.確定樣本單位數n=N×20%=180×20%=36人;
2.每班的樣本單位數分別為2023/7/22第七章抽樣調查46各類型之間樣本單位數的分配1.等比例分配即各層所抽樣本數占各層總體單位數的比例相等。2.不等比例分配例:按各層的離散情況分配樣本:某層的離散程度大,則該層多分攤一些樣本分層抽樣的優點分類的原則:擴大組間差異,縮小組內差異2023/7/22第七章抽樣調查47(三)整群抽樣1、概念:又稱集團抽樣
抽樣的單位不是單個的個體,而是成群的個體。它是從總體中隨機抽取一些小的群體,然后由所抽出的若干個小群體內的所有元素構成調查的樣本。對小群體的抽取可采用簡單隨機抽樣、系統抽樣和分層抽樣的方法。如下圖:
2023/7/22第七章抽樣調查482、整群抽樣的主要優缺點
優點:簡便易行、節省費用,特別是在總體抽樣框難以確定的情況下非常適合。缺點:若樣本分布比較集中、代表性相對較差。一般來說,當類別相對較多、每一類中個體相對較少的情況時效果較好。2023/7/22第七章抽樣調查49抽樣的樣本就是要差異大才能盡可能包含所有情況,誤差才會小分層抽樣與整群抽樣的區別:分層抽樣要求各子群體之間的差異較大,而子群體內部差異較小;整群抽樣要求各子群體之間的差異較小,而子群體內部的差異性很大。換句話說,分層抽樣是用代表不同子群體的子樣本來代表總體中的群體分布;整群抽樣是用子群體代表總體,再通過子群體內部樣本的分布額來反映總體樣本的分布。2023/7/22第七章抽樣調查50(四)等距抽樣1、概念:系統抽樣或機械抽樣2、抽取樣本的具體方法(1)隨機等距(2)對稱等距(3)中點等距3、等距抽樣的計算2023/7/22第七章抽樣調查51
把總體的單位進行排序,再計算出抽樣距離,然后按照這一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新解讀《CB-T 3859 - 1999錨鏈產品質量評級》新解讀
- DBJ04-T489-2025 《智慧園林建設標準》
- 三級安全教育考試題
- AI技術服務合同
- 浙江省杭州市上城區2023-2024學年四年級下學期數學期末試卷(含答案)
- Brand KPIs for health insurance:State Farm in the United States-英文培訓課件2025.4
- 初中英語八年級下冊統編教案 uunit1
- 初中英語七年級下冊統編教案 七下Unit6 Outdoor fun第3課時
- 從加強支部活動方案
- 倉儲超市開業活動方案
- 2025年保安證考試答題技巧與試題答案
- 中級宏觀經濟學知到課后答案智慧樹章節測試答案2025年春浙江大學
- ASTM-D3359-(附著力測試標準)-中文版
- DL-T5706-2014火力發電工程施工組織設計導則
- 全國工會財務知識競賽題庫及答案
- 消防管道無水消防應急預案
- 汽車電工電子教案
- PKPM2005入門(版)
- XIRR測算公式本金(模板)
- 基礎圖案裝飾圖案(課堂PPT)
- 專業檢查表——季度——儀表專項安全檢查表
評論
0/150
提交評論