抽樣推斷概述精品課件_第1頁
抽樣推斷概述精品課件_第2頁
抽樣推斷概述精品課件_第3頁
抽樣推斷概述精品課件_第4頁
抽樣推斷概述精品課件_第5頁
已閱讀5頁,還剩56頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、抽樣推斷概述第1頁,共61頁,2022年,5月20日,14點31分,星期三第一節 抽樣推斷概述 指樣本單位的抽取不受主觀因素及其他系統性因素的影響,每個總體單位都有均等的被抽中機會一、抽樣推斷按照隨機原則從總體中抽取一部分單位進行觀察,并依據所獲得數據的處理結果,對總體的數量特征做出具有一定可靠程度的估計和判斷,從而達到對總體的分布狀況及其數量特征認識的目的。第2頁,共61頁,2022年,5月20日,14點31分,星期三統計推斷全及總體指標:參數(未知量)樣本總體指標:統計量(已知量)抽樣推斷第3頁,共61頁,2022年,5月20日,14點31分,星期三按隨機原則抽取樣本單位以樣本的數量特征推

2、斷總體的數量特征抽樣推斷產生抽樣誤差,但抽樣誤差可以事先計算并控制抽樣推斷的特點第4頁,共61頁,2022年,5月20日,14點31分,星期三()用于無法采用或不必采用全面調查的現象;(2)對全面調查的結果進行復核;(3)生產過程的質量控制;(4)對總體的假設進行檢驗。抽樣推斷的應用第5頁,共61頁,2022年,5月20日,14點31分,星期三設計抽樣方案抽取樣本單位收集樣本數據計算樣本統計量推斷總體參數抽樣推斷的一般步驟第6頁,共61頁,2022年,5月20日,14點31分,星期三二、抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認識研究對象的全體,它由具有某種共同性質或特征的單位

3、所組成。常用N表示全及總體的單位數目。又稱樣本或子樣,是指從全及總體中按照隨機原則抽取的那部分個體的組合。抽樣總體的單位數稱為樣本容量,通常用n表示。1nN 。例如:在100萬戶居民中,隨機抽取1000戶居民進行家庭收支情況調查,其中的100萬戶居民就是全及總體,而被抽中的1000戶居民則構成抽樣總體。n30稱為大樣本,n 30稱為小樣本.n/N稱為抽樣比.第7頁,共61頁,2022年,5月20日,14點31分,星期三設總體中 個總體單位某項標志的標志值分別為 ,其中具有某種屬性的有 個單位,不具有某種屬性的有 個單位,則 總體平均數(又叫總體均值):根據全及總體各個單位的標志值或標志特征所計

4、算的反映總體某種屬性的綜合指標 ,又稱總體參數。全及指標第8頁,共61頁,2022年,5月20日,14點31分,星期三 總體單位標志值的標準差: 總體單位標志值的方差:第9頁,共61頁,2022年,5月20日,14點31分,星期三 總體成數: 總體是非標志的標準差: 總體是非標志的方差:第10頁,共61頁,2022年,5月20日,14點31分,星期三設樣本中 個樣本單位某項標志的標志值分別為 ,其中具有和不具有某種屬性的樣本單位數目分別為 和 個,則 樣本平均數(又叫樣本均值):指根據抽樣總體各個單位的標志值或標志特征計算的綜合指標,又被稱為統計量,它是隨機變量。抽樣指標第11頁,共61頁,2

5、022年,5月20日,14點31分,星期三 樣本單位標志值的標準差: 樣本單位標志值的方差:為自由度為 的無偏估計為 的無偏估計第12頁,共61頁,2022年,5月20日,14點31分,星期三 樣本成數: 樣本單位是非標志的標準差: 樣本單位是非標志的方差:為 的無偏估計為 的無偏估計第13頁,共61頁,2022年,5月20日,14點31分,星期三抽樣方法的分類重復抽樣從總體N個單位中隨機抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣不重復抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數

6、N不變,同一單位可能多次被抽中。總體單位數減少n,同一單位只可能被抽中一次。根據取樣方式不同,可分為:第14頁,共61頁,2022年,5月20日,14點31分,星期三三、抽樣誤差 1、統計誤差的種類統計誤差是指統計數據與客觀實際數量之間的差距。有兩種情況:(1)登記性誤差。指在調查、整理過程中,由于各種主觀原因引起的誤差。(2)代表性誤差。指由于樣本單位的結構情況不足以代表總體所產生的誤差。又分兩種:第15頁,共61頁,2022年,5月20日,14點31分,星期三系統性誤差。由于違反了抽樣調查的隨機原則而產生的誤差。隨機性誤差。由于遵守抽樣的隨機原則,但可能抽到不同的樣本而產生的誤差。又分兩種

7、:實際誤差:某一樣本指標與總體指標之間的差異;平均誤差:所有可能出現的樣本指標與總體指標的平均離差。第16頁,共61頁,2022年,5月20日,14點31分,星期三舉例計算抽樣平均誤差設有4個工人,每人的日產量分別為40、50、70、80,現隨機抽選2人,求平均日產量,用以代表4人總體的平均日產量。總體平均日產量總體標準差第17頁,共61頁,2022年,5月20日,14點31分,星期三序號樣本變量樣本平均數平均數離差離差平方和1234567891011121314151640,4040,5040,7040,8050,4050,5050,7050,8070,4070,5070,7070,8080

8、,4080,5080,7080,8040455560455060655560707560657580-20-15-50-15-1005-501015051520400225250225100025250100225025225400和-960-2000第18頁,共61頁,2022年,5月20日,14點31分,星期三 重復抽樣條件下: 樣本平均數的平均數 樣本平均誤差第19頁,共61頁,2022年,5月20日,14點31分,星期三序號樣本變量樣本平均數平均數離差離差平方和1234567891011121314151640,5040,7040,8050,4050,7050,8070,4070,50

9、70,8080,4080,5080,70455560456065556075606575-15-50-1505-50150515225250225025250225025225和-720-1000第20頁,共61頁,2022年,5月20日,14點31分,星期三 不重復抽樣條件下: 樣本平均數的平均數 樣本平均誤差第21頁,共61頁,2022年,5月20日,14點31分,星期三四、抽樣平均誤差的計算 樣本平均數的抽樣平均誤差當N500時,有重復抽樣時:不重復抽樣時:第22頁,共61頁,2022年,5月20日,14點31分,星期三 樣本成數的抽樣平均誤差重復抽樣時:不重復抽樣時:當N500時,有抽

10、樣平均誤差的計算公式第23頁,共61頁,2022年,5月20日,14點31分,星期三以上例驗證抽樣誤差的公式:重復抽樣條件下不重復抽樣條件下第24頁,共61頁,2022年,5月20日,14點31分,星期三關于總體方差的估計方法用過去同類問題全面調查或抽樣調查的經驗數據代替;用樣本標準差 代替總體標準差 ,用 代替 。抽樣平均誤差的計算公式第25頁,共61頁,2022年,5月20日,14點31分,星期三影響抽樣誤差的因素總體各單位標志值的差異程度(即標準差的大小): 越大,抽樣誤差越大;樣本單位數的多少: 越大,抽樣誤差越小;抽樣方法:不重復抽樣的抽樣誤差比重復抽樣的抽樣誤差小;抽樣組織方式:簡

11、單隨機抽樣的誤差最大。第26頁,共61頁,2022年,5月20日,14點31分,星期三例:已知某一總體的平均數未知,總體方差為0.09,現簡單隨機抽取4個單位,其樣本單位的標志值為15.7、16.3、15.9、16.1,試求其抽樣誤差。第27頁,共61頁,2022年,5月20日,14點31分,星期三例:從一批產品中隨機抽取100件,測得一級品為95件,試求一級品率的抽樣誤差。第28頁,共61頁,2022年,5月20日,14點31分,星期三抽樣極限誤差指在一定的概率保證程度下,抽樣指標與總體指標之間抽樣誤差的最大可能范圍,也稱作抽樣允許誤差。常用表示。上式表明,樣本平均數(成數)是以總體平均數(

12、成數)為中心,在相應的區間內變動。第29頁,共61頁,2022年,5月20日,14點31分,星期三由于總體成數和總體平均數是未知的,它要求靠實測的抽樣平均數和抽樣成數來估計,因而抽樣誤差的實際意義是希望總體平均數(成數)落在某個已知的范圍內。抽樣極限誤差所以前面的不等式應變換為:在一個特定的全及總體中,當抽樣方法和樣本容量固定時,抽樣平均誤差是一個定值,因此,抽樣極限誤差通常以抽樣平均誤差為標準單位來衡量。即抽樣極限誤差通常表示為抽樣平均誤差的多少倍。 由于t值與樣本估計值落入允許誤差范圍內的概率有關,因此,t也稱為概率度。第30頁,共61頁,2022年,5月20日,14點31分,星期三抽樣估

13、計的置信度抽樣指標和總體指標的誤差不超過一定范圍的概率大小,我們將它稱之為概率保證程度,也叫抽樣估計的置信度,一般用F(t)表示。即: 置信度t值與相應的概率保證程度存在一一對應關,常用t值及相應的概率保證程度為: t值 概率保證程度1.00 0.6827 1.96 0.9500 2.00 0.9545 3.00 0.9973在大樣本下第31頁,共61頁,2022年,5月20日,14點31分,星期三68.27%95.45%99.73%抽樣極限誤差與置信度第32頁,共61頁,2022年,5月20日,14點31分,星期三第二節 參數估計 也叫抽樣估計,就是根據樣本指標數值對總體指標數值作出估計或推

14、斷。 參數估計通常,把用來估計總體特征的樣本指標叫估計量或統計量,待估計的總體指標叫總體參數。方法點估計區間估計第33頁,共61頁,2022年,5月20日,14點31分,星期三點估計量的優良標準無偏性、有效性、一致性第34頁,共61頁,2022年,5月20日,14點31分,星期三區間估計給出一個區間(置信區間)并推斷真正的參數以一定的概率存在于這個區間的方法。第35頁,共61頁,2022年,5月20日,14點31分,星期三以樣本統計量為中心,以抽樣平均誤差為距離單位,可以構造一個區間,并可以一定的概率保證待估計的總體參數落在這個區間之中。區間越大,則概率保證程度越高。區間估計原理第36頁,共6

15、1頁,2022年,5月20日,14點31分,星期三總體平均數的區間估計表達式其中, 為極限誤差第37頁,共61頁,2022年,5月20日,14點31分,星期三步驟 計算樣本平均數 ; 搜集總體方差的經驗數據 ;或計算樣本標準差 ,即總體平均數的區間估計第38頁,共61頁,2022年,5月20日,14點31分,星期三步驟 計算抽樣平均誤差:重復抽樣時: 不重復抽樣時:總體平均數的區間估計第39頁,共61頁,2022年,5月20日,14點31分,星期三步驟 計算抽樣極限誤差: 確定總體平均數的置信區間:總體平均數的區間估計第40頁,共61頁,2022年,5月20日,14點31分,星期三【例A】某企

16、業生產某種產品的工人有1000人,某日采用不重復抽樣從中隨機抽取100人調查他們的當日產量,要求在95的概率保證程度下,估計該廠全部工人的日平均產量和日總產量。總體平均數的區間估計第41頁,共61頁,2022年,5月20日,14點31分,星期三按 日產量分組(件)組中值(件)工人數(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計100126004144100名工人的日

17、產量分組資料第42頁,共61頁,2022年,5月20日,14點31分,星期三解:第43頁,共61頁,2022年,5月20日,14點31分,星期三則該企業工人人均產量 及日總產量 的置信區間為:即該企業工人人均產量在124.至127.件之間,其日總產量在124至127件之間,估計的可靠程度為95第44頁,共61頁,2022年,5月20日,14點31分,星期三總體成數的區間估計表達式其中, 為極限誤差第45頁,共61頁,2022年,5月20日,14點31分,星期三步驟 計算樣本成數 ; 搜集總體方差的經驗數據 ; 計算抽樣平均誤差:重復抽樣條件下不重復抽樣條件下總體成數的區間估計第46頁,共61頁

18、,2022年,5月20日,14點31分,星期三步驟 計算抽樣極限誤差: 確定總體成數的置信區間:總體成數的區間估計第47頁,共61頁,2022年,5月20日,14點31分,星期三【例B】若例A中工人日產量在118件以上者為完成生產定額任務,要求在95的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數。總體成數的區間估計第48頁,共61頁,2022年,5月20日,14點31分,星期三按 日產量分組(件)組中值(件)工人數(人)11011411411811812212212612613013013413413813814211211612012412813213614037

19、1823211864合計100100名工人的日產量分組資料完成定額的人數第49頁,共61頁,2022年,5月20日,14點31分,星期三解:第50頁,共61頁,2022年,5月20日,14點31分,星期三則該企業全部工人中完成定額的工人比重 及完成定額的工人總數 的置信區間為:即該企業工人中完成定額的工人比重在0.84至0.95之間,完成定額的工人總數在84.至95.人之間,估計的可靠程度為95。第51頁,共61頁,2022年,5月20日,14點31分,星期三樣本容量的確定影響樣本容量的因素總體各單位標志值的差異程度(即標準差的大小): 越大,所需樣本容量越多允許的極限誤差的大小: 越大,所需

20、樣本容量越小;推斷的可靠程度,即置信度:對可靠程度要求越高,所需樣本容量越大;抽樣方法和抽樣組織方式:重復抽樣比不重復抽樣所需樣本容量要多;類型抽樣比簡單隨機抽樣所需樣本容量多。第52頁,共61頁,2022年,5月20日,14點31分,星期三確定方法推斷總體平均數所需的樣本容量 重復抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。 或 S通常未知。一般按以下方法確定其估計值:過去的經驗數據;試驗調查樣本的S。計算結果通常向上進位第53頁,共61頁,2022年,5月20日,14點31分,星期三 不重復抽樣條件下:確定方法推斷總體平均數所需的樣本容量第54頁,共61頁,2022年,5月20日,14點31分,星期三【例A】某食

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論