第2章 簡單隨機抽樣ppt課件_第1頁
第2章 簡單隨機抽樣ppt課件_第2頁
第2章 簡單隨機抽樣ppt課件_第3頁
第2章 簡單隨機抽樣ppt課件_第4頁
第2章 簡單隨機抽樣ppt課件_第5頁
已閱讀5頁,還剩53頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第2章 簡單隨機抽樣SRS2.1 定義及其抽選方法2.2 簡單估計量及其性質2.3 樣本量確實定2.4 設計效應2.5 逆抽樣 .2.1定義與符號簡單隨機抽樣也稱為純隨機抽樣。從含有 N 個單元的總體中抽取 n 個單元組成樣本,假設抽樣是不放回的,那么一切能夠的樣本有 個,假設每個樣本被抽中的概率一樣,都為 ,這種抽樣方法就是簡單隨機抽樣。詳細抽樣時,通常是逐個抽取樣本單元,直到抽滿n個單元為止。 有限.放回簡單隨機抽樣不放回簡單隨機抽樣放回簡單隨機抽樣(SRS with replacement)當從總體N個抽樣單元中抽取n個抽樣單元時,假設依次抽取單元時,不論以前能否被抽中過,每次都從N個抽

2、樣單元中隨機抽取,這時,一切能夠的樣本為 ? 個(思索樣本單元的順序),每個樣本被抽中的概率為?放回簡單隨機抽樣在每次抽取樣本單元時,都將前一次抽取的樣本單元放回總體,因此,總體的構造不變,抽樣是相互獨立進展的,這一點是它與不放回簡單隨機抽樣的主要不同之處。放回簡單隨機抽樣的樣本量不受總體大小的限制,可以是恣意的。.簡單隨機抽樣的抽取原那么:1按隨機原那么取樣;2每個抽樣單元被抽中的概率都是知的或事先確定的;3每個抽樣單元被抽中的概率都是相等的。一切能夠樣本每個樣本被抽中的概率一樣一切能夠樣本每個樣本被抽中的概率一樣.【例2.1】設總體有5個單元1、2、3、4、5,按放回簡單隨機抽樣的方式抽取

3、2個單元,那么一切能夠的樣本為25個思索樣本單元的順序:1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5.(2)不放回簡單隨機抽樣(SRS without replacement)當從總體N個抽樣單元中依次抽取n個抽樣單元時,每個被抽中的單元不再放回總體,而是從總體剩下的單元中進展抽樣。不放回簡單隨機抽樣的樣本量要受總體大小的限制。在實踐任務中,更多的采用不放回簡單隨機抽樣。. 【例2.2】設總體有5個單元1、2、3、4、5,按不放回簡單隨機抽樣的方式抽取2個單元,那么一切能夠的樣本為個:1,

4、22,33,44,51,32,43,51,42,51,5.符號 大寫符號表示總體的標志值,用小寫符號表示樣本的標志值 總 體樣 本 .總體目的值上面帶符號“的表示由樣本得到的總體目的的估計。 稱 為抽樣比,記為f 。估計量的方差用大寫的V表示,對 的樣本估計,不用 而用 表示。 .二、抽選方法1抽簽法 2隨機數法隨機數表、隨機數骰子、搖獎機、計算機產生的偽隨機數 隨機數表法:N=327 n5討論: (1) 總體編號為135,在0099中產生隨機數,假設=00或35,那么丟棄重抽。 (2) 總體編號為135,在0099中產生隨機數,以除以35,余數作為被抽中的數,假設余數為0,那么被抽中的數為3

5、5。.三、位置與作用優點簡單直觀實際根底缺陷N很大時難以獲得抽樣框樣本分散不易實施,調查費用高很少單獨運用,普通結合其他方法運用沒有其他信息時運用多變量復雜數據分析.2.2 簡單估計量及其性質 判別下面要估計的總體目的量分別屬于什么類型?調查城市居民家庭平均用電量。估計湖中魚的數量。測試日光燈的壽命。估計居民家庭用于做飯菜及飲用的用水量占家庭總用水量的比重。估計嬰兒出生性別比。檢測食鹽中碘含量。. 一、對總體均值的估計 以樣本均值作為總體均值的估計性質1:對于簡單隨機抽樣, 是 的無偏估計。 .例設總體為0,1,3,5,6,計算總體均值 =3、總體方差 =5.2和 =6.5;給出全部 的樣本,

6、并驗證 及 。 1010.5-2.50.52031.5-1.54.53052.5-0.512.540630185132-126153087163.50.512.58354129364.51.54.510平均565.52.50.5306.5方差1.95樣本編號單元1單元2樣本均值-樣本方差. 證明 性質1 對于固定的有限總體,估計量的期望是對一切能夠樣本求平均得到的,因此總體中每個特定的單元 在不同的樣本中出現的次數。 .證明 性質1對稱性論證法 由于每個單元出如今總體一切能夠樣本中的次數一樣,因此 一定是 的倍數,且這個倍數就是 , .性質2:對于有限總體的方差定義 :性質2:對于簡單隨機抽樣

7、, 的方差式中: 為抽樣比, 為有限總體校正系數。 .證明性質2對稱論證法: 中的求和是對 項的, 中的求和是對 項的.每個特定單位被選入樣本的概率: =Pi=故其定義為:* 不放回抽樣* 每個樣本被抽中的概率為* 每個單位被選入樣本的概率 利用無限總體實際. Mean =隨機變量.證明性質2.簡單隨機抽樣下,簡單估計量估計精度影響要素: 估計量的方差 是衡量估計量精度的度量。影響估計量方差的要素主要是樣本量n,總體大小N和總體方差 。通常N很大,當f0.05時,可將 近似取為1。 總體方差是我們無法改動的;因此,在簡單隨機抽樣的條件下,只需經過加大樣本量來提高估計量的精度。 . 性質3: 的

8、樣本無偏估計為: 證明 :.大樣本下,抽樣調查估計量漸進正態 .【例2.3】我們從某個=100的總體中抽出一個大小為=10的簡單隨機樣本,要估計總體平均程度并給出置信度為95%的區間估計。序號1234567891045204661508.由置信度95%對應的 ,因此,可以以95%的把握說總體平均程度大約在 之間,即2.4295和7.5705之間。.有放回簡單隨機抽樣.二、對總體總量的估計 .【例2.4】續例2.3。估計總體總量,并給出在置信度95%的條件下,估計的極限相對誤差。在置信度95%下, 的極限相對誤差為:.三、對總體比例的估計 某一類特征的單元占總體單元數中的比例P.將總體單元按能否

9、具有這種特征劃分為兩類,設總體中有個單元具有A這個特征,假設對每個單元都定義目的值 .總體方差: .估計量 性質5:對于簡單隨機抽樣, 是 P 的無偏估計。 的方差為: .證明. 【例2.5】 某超市新開張一段時間之后,為改良銷售效力環境,欲調查附近幾個小區居民到該超市購物的稱心度,該超市與附近幾個小區的居委會獲得聯絡,在總體中按簡單隨機抽樣抽取了一個大小為=200人的樣本,調查發現對該超市購物環境表示稱心或根本稱心的居民有130位,要估計對該超市購物環境持一定態度居民的比例,并在置信度95%下,給出估計的近似置信區間、極限絕對誤差。假定這時的抽樣比可以忽略。.95%近似置信區間為 58.37

10、%,71.63% .2.3 樣本量確實定費用 總費用 固定費用 可變費用 設計費分析費辦公費管理費場租費等訪問員費交通費禮品費費等.STEPS所需求的精度找出樣本量與精度之間的關系估計所需的數值,求解 n如超出預算,調整精度值重新計算.精度margin of error對精度的要求通常以允許最大絕對誤差絕對誤差限或允許最大相對誤差 相對誤差限來表示。 .樣本量足夠大時,可用正態分布近似 變異系數 .Sample Size n0為反復抽樣條件下的樣本量當N很大時, 0, n n0,wr與wor幾乎沒有區別。.總體參數為P的情形. f0.05 .總體方差的估計根據預調查數據或以前文獻資料根據數據的

11、分布粗略估算S,例如全距/4,全距/ 6對于比例估計,假設P在0.5附近,可根據PQ在P=0.5時到達極大值來對樣本量進展計算 .假設時間允許,且總體在時間上變化不快,調查可以分為兩步,首先確定一個可以接受的樣本量,調查后對估計精度進展計算,假設精度到達要求,那么不再進展下一步,否那么,計算為到達精度要求所需的樣本量,再調查補充樣本經過定性分析 ,最好是對總體變異系數進展分析并估計,由于變異系數通常變化不大.樣本量設計中的誤區 1. 估計精度越高越好嗎? 簡單隨機抽樣估計比例P的樣本量與誤差當P=0.5時 樣本量 誤差d 50 0.14 100 0.10 500 0.045 1000 0.03

12、2 10000 0.0098 對精度要求的判別非常重要。為得到最小誤差而選擇最大樣本量不是好的選擇。.2. 樣本量與總體規模N有關嗎?按照總體比例確定樣本量適宜嗎?例:簡單隨機抽樣估計P,置信度95%,允許誤差5%,在P=0.5條件下 總體規模N 所需樣本量n 50 44 100 80 500 222 1000 286 5000 370 10000 385 100000 398 1000000 400 10000000 400 .抽樣調查中的樣本量 由此可知,在精度要求一樣條件下,在北京市進展一項調查和在全國進展一項調查,樣本量的差別并不大。 總體規模越大,進展抽樣調查的效率越高。 假設分類、

13、分區、分層分別進展估計,如何處置? 對于多工程,如何處置?.其他影響要素1. 所研討問標題的量的個數2. 調查表的回收率 例如回收率估計為80%,那么應接觸的樣本量為計算出所需樣本量的1.25倍;3.非抽樣誤差4.資源限制5.有效樣本etc. 定義:簡單隨機抽樣的樣本估計量的方差與復雜抽樣的樣本估 計 量的方差的比率。 Deff Var 為復雜樣本估計量的方差。2.4 設計效果(Design effect, Deff).設計效應基什L. Kish提出 比較不同抽樣方法的效率. 不放回簡單隨機抽樣簡單估計量的方差 某個抽樣設計在同樣樣本量條件下估計量的方差。 . Deff的作用: 1評價抽樣設計的一個根據, 假設deff1, 那么抽樣設計比簡單隨機抽樣的效率低。2計算樣本量如多階段抽樣的 Deff大約在22.5之間。 n= n(deff) n為簡單隨機抽樣所需樣本量。.放回簡單隨機抽樣的deff為: 常用于復雜抽樣樣本量確實定;在一定精度條件下,簡單隨機抽樣所需的樣本量比較容易得到,復雜抽樣的樣本量為, .2.5 稀有事件的抽樣問題假設估計的是非常稀有事件的比例,這時總體比例很小,用極限相對誤差比極限絕對誤差更好

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論