




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計學授課題目第6章抽樣推斷課次第8-9次授課方式講授課時安排第8教學周-第9教學周,共4課時教學目的:通過本章的學習,要求掌握利用樣本統計資料來推斷總體數量特征的原理及方法;深刻理解抽樣推斷的概念及特點;了解抽樣誤差產生的原因,并對抽樣誤差、抽樣平均誤差、抽樣極限誤差加 以區別,掌握抽樣平均誤差、抽樣極限誤差的計算;掌握點估計和區間估計的方法;掌握必要樣本 單位數的確定方法。教學重點及難點提小:重點:區間估計難點:抽樣平均誤差的計算案例導入:大學生消費調查:一個月你花多少第T 抽樣推斷概述一、抽樣推斷的概念及特點(一)概念按隨機原則從總體中抽取部分單位,根據這部分單位的信息對總體的數量特征進
2、行 科學倩計與推斷的方法。包括抽樣調查和統計推斷抽樣調查:一種非全面調查,按隨機原則從總體中抽取部分單位進行調查以獲得相關資料,以推斷總體統計推斷:根據抽樣調查所獲得的信息,對總體的數量特征作出具有一定程度的估教法提示:多媒體教學案例教學列舉法計和推斷。(二)特點.按隨機原則(等可能性原則)抽取調查單位.隨機抽樣的目的是為了排除人的主觀影響,使每個樣本都有系統的可能性被抽中,使樣本對總體具有充分的代表性。隨機性原則是保證抽樣推斷正確性的一個重要前提條件。隨機抽樣不是隨便抽樣。.根據部分推斷總體的數量特征.抽樣推斷的結果具有一定的可靠性和準確性,抽樣誤差可以事先計算和控制其他特點有經濟性、時效性
3、、準確性、靈活性等(三)抽樣推斷的應用不可能進行全面調查時不必要進行全面調查時檢查生產過程正常與否對全面調查資料進行補充修正時二、抽樣的幾個基本概念.樣本容量與樣本個數30(1)樣本容量:樣本是從總體中抽出的部分單位的集合,這個集合的大小稱為樣本 容量,一般用n表示,它表明一個樣本中所包含的單位數。一般地,樣本單位數大于 個的樣本稱為大樣本,不超過 30個的樣本稱為小樣本。(2)樣本個數:又稱樣本可能數目,它是指從一個總體中可能抽取多少個樣本。樣 本個數的多少與抽樣方法有關。.總體參數與樣本統計量(1)總體參數:總體分布的數量特征就是總體參數,也是抽樣統計推斷的對象。常見的總體參數有:總體的平
4、均數指標,總體成數(比重)指標,總體分布的方差、標準差等等。(2)樣本統計量:與總體參數對應的是樣本統計量。設(Xi,X2L ,Xn)是總體X容量為n的樣本,若樣本函數T T (Xi,X2L ,Xn)中不含任何未知參數,則稱 T為一個統計量。例如就是一個統計量,稱為樣本均值(Sample mean),S2(Xi X)也是統計量,稱為樣本方差(Sample variance3.重復抽樣與不重復抽樣(1)重復抽樣:是指從總體中抽出一個樣本單位,記錄其標志值后,又將其放回總 體中繼續參加下一次樣本單位的抽取。(2)不重復抽樣:即每次從總體中抽取一個單位,登記后不放回原總體,不參加下 一次抽樣。第二節
5、抽樣推斷的方法、點估計(一)點估計的概念及特點參數估計:以樣本統計量對總體參數進行估計,有點估計和區間估計兩種。點估計:直接以樣本統計量作為相應的總體參數的估計量。優點:直接給出了總體參數的具體數值缺點:未能反映誤差的大小參數點估計有:? x(1)樣本均值估計總體均值? p TOC o 1-5 h z (2)樣本成數估計總體成數L?2S2(3)樣本方差估計總體方差(二)估計的評價標準:(1)無偏性:設? t (XjX2,!. ,Xn)是未知參數 的一個點估計量,若?滿足E?即估計量的數學期望等于被估計參數則稱?是的無偏估計量,否則稱為有偏估計量。需要注意的是,由于估計量 ?是樣本(Xl,X2,
6、L,Xn)的函數,樣本量是n維隨機變 量,所以對 ?求平均是按樣本(Xl,X2,L ,Xn)的概率分布求平均。無偏性是我們衡量點估計量好壞的一個評價標準,這個評價標準的直觀意義如下:由于樣本的出現帶有隨機性,所以基于一次具體抽樣所得的參數估計值未必等于參數真值,這是由樣本的隨機性造成的。我們希望當大量使用這個估計量對參數進行倩計時,一系列估計值的平均值應該與待估參數真值相等。這就從平均效果上對估計量的優劣給 出一個評價標準。(2)功效性:?T /V VIV ?丁 /V VIV 設1Ti (X1,X2,L,Xn)2丁2 (Xi,X2,L,Xn)均為未知參數的無偏估計?量,如果對參數日勺一切口能取
7、值有2(?)2( ?2),則稱無偏估計量 1比2有效一個無偏估計量并不意味著他就非常接近被借計的參數,他還必須與總體參數的離散程度比較小。對同一總體參數的兩個無偏點估計量,方差小者更有效。(3) 一B 性:指隨著樣本單位數 n的增大,樣本估計量將在概率意義下越來越接近于總體真實值若對于任意 0,有lim P ?1n二、區間估計法在參數倩計中,雖然點估計可以給出未知參數的一個情計,但不能給出倩計的精度。為此人們希望利用樣本給出一個范圍,要求它以足夠大的概率包含待估參數真值。這就 是導致區間估計問題。所謂區間估計,就是倩計總體參數的區間范圍,并要求給出區間估計成立的概率值。設 是未知參數,(X1,
8、X2,L ,Xn)是來自總體的樣本,構造兩個統計量 ? T1 (X1,X2,L ,Xn), 2 T2(X1,X2,L ,Xn),對于給定的(0 1),若?、2滿足則稱隨機區間2 是參數的置信水平為1的置信區間,1稱為21的置信度,5稱為置信限。這里有幾點需要說明:(1)區間馬的端點?,及長度?都是樣本的函數,從而都是隨機變量,因此是一個隨機區間。的概率包含未知參數真值,區間長度2- 1描述估計的精度,置信水平1描述了估計的可靠度。(3)因為未知參數是非隨機變量,所以不能說落入區間1,而應是隨機區間2:包含的概率是11 是說隨機區間通俗地說,在點估計的基礎上,給出總體參數的一個范圍稱為區間估計。
9、(二)總體均值的區間估計.正態總體且方差已知;或非正態總體、方差未知、大樣本情況下在這種情況下,樣本均值的抽樣分布呈正態分布,其數學期望為總體均值2為。則X z 尸稱為總體均值在1置信水平下的置信區間。n2 n區間估計步驟:1.計算樣本統計量x, pxp2,計算抽樣平均誤差3,計算極限誤差X,x Xp p, p p4,確定置信區間NXNP5,估計總量指標注意抽樣方法的不同例保險公司從投保人中隨機抽取36人,計算得36人的平均年齡 X39,5 歲,已知投保人平均年齡近似服從正態分布,標準差為歲,試求全體投保人平均年齡的置信水平為99%勺置信區間。解:10,99,0,01,查 N (0,1)表得
10、Z22.57539,5 2,5757,236,41 :3639,5 2,5757,2-一 42,59 .36故全體投保人平均年齡的置信水平為99%勺置信區間為,若總體方差 2未知,可用樣本方差 S2代替即土 =,投保人平均年齡在 90%的置信水平下的置信區間為歲歲。.正態總體、方差未知、小樣本情況下如果總體服從正態分布,無論樣本容量大小,樣本均值的抽樣分布都服從正態分布。 只要總體方差已知,即使在小樣本情況下,也可以計算總體均值的置信區間。如果總體 方差2未知,需用樣本方差 S2代替,在小樣本情況下,應用 t分布來建立總體均值的置 信區間。t分布是類似正態分布的一種對稱分布,他通常要比正態分布
11、平坦和分散。隨著自由度的增大,t分布逐漸趨于正態分布。正態總體、方差未知、小樣本情況下,總體均值在1置信水平下的置信區間為:sX t -j=(重復抽樣條件下)X t 阜JN(不重復抽樣條件下)2 n . N 1其中t (n 1)為t分布臨界值,可以查t分布臨界值表得到(三)成數的區間估計在大樣本(一般經驗規則:np 5和n(1 p) 5)條件下,樣本比例的抽樣分布可用正態分布近似。在這種情況下,數理統計已經證明如下結論:置信水平為1的置信區間為:(重復抽樣)p Z Zp(1 P)(N_n)(不重復抽樣)2 n N 1例某城市想要估計下崗職工中女性所占的比例,采取重復抽樣方法隨機抽取了 100名
12、下崗職工,其中65人為女性。試以95%的置信水平估計該城市下崗職工中女性所 占比例的置信區間。一 .65解:已知 n 100, z. 1.96, p 65%2100根據公式得:p Z ,函詢 65% 1.96 . 65% (1 65%) HYPERLINK l bookmark40 o Current Document 2 . n.100即65% 土 =%), 95%的置信水平下估計該城市下崗職工中女性所占比例的置信區 間為唳%例某企業共有職工1000人,企業準備實行一項改革,在職工中征求意見,采用不重復抽樣方法,隨機抽取200人作為樣本,調查結果顯示,由150人表示贊成這項改革,有50人表示
13、反對。試以95 %的置信水平確定贊成改革的人數比例的置信區間。一一,150解:已知 n 200, z 1.96, p 75% 2200根據公式得:pZ,p(1np)(N;)75% 1.96 .175%(1.75%)(1000-200) 丫 2001000 1即75% 土 =% %), 95 %的置信水平下估計贊成改革的人數比例的置信區間為三、樣本容量的確定(一)影響樣本容量的意義在抽取樣本時樣本容量應多大是一個很實際的問題。樣本容量取得比較大,收集的信息就比較多,從而估計精度比較高,但進行觀測所投入的費用、人力及時間就比較多;樣本容量取得比較小,則投入的費用、人力及時間就比較少,但收集的信息也
14、比較少,從而估計精度比較低。這說明精度和費用對樣本量的影響是矛盾的,不存在既使精度最高又使費用最省的樣本量。一個常用的準則是在使精度得到保證的前提下尋求使費用最省的樣本量。由于費用通常是樣本量的正向線性函數,故使費用最省的樣本量也就是使 精度得到保證的最小樣本量。(二)倩計總體均值時樣本容量的確定22z 重復抽樣條件下:n 上在簡單隨機/、重復抽樣條件下,M 22Nz n N 2 z2 22b或S通常未知。一般按以下方法確定其估計值:過去的經驗數據;試驗調查樣本的So例 在某企業中采用簡單隨機抽樣調查職工月平均獎金額,設職工月獎金額服從標準差為10元的正態分布,要求倩計的絕對誤差為3元,可靠度
15、為95%試問應抽多少職工解:已知10310.95z_ 1.96則2二 222z21.962 102n42.68 43232即需抽取43名職工作為樣本進行調查。(三)倩計成數時樣本大小的確定在簡單隨機重復抽樣條件下,得到樣本容量:_2_一Z P(1 P)n 二一2一(重復抽樣條件下)P在簡單隨機不重復抽樣條件下,我們可以得出倩計總體比例時樣本容量的計算公式為:NZ2P(1 P)n (/、重復抽樣條件下)N P2 Z2P(1 P)T例根據以往的生產統計,某種產品的合格率為90%現要求絕誤差為 5%在置信水平為95%勺置信區間時,應抽取多少個產品作為樣本已知,P 90% P 5% Z 1.96萬一
16、2 -八z P(1 P) 1.962 0.9 (1 0.9)貝Un 2=2 139P20.052必要樣本容量的影響因素.總體力差的大小;.允許誤差范圍的大小;.概率保證程度;.抽樣方法;.抽樣的組織方式。第二節抽樣的組織形式抽樣的組織形式有純隨機抽樣、機械抽樣、類型抽樣、整群抽樣和多階段抽樣。一、純隨機抽樣.含義:對總體單位逐一編號,然后按隨機原則直接從總體中抽出若干單位構成樣本.特點:最符合抽樣調查的隨機原則,是基本形式。簡便易行。.范圍:僅適用于單位數不多、標志變異較小、分布較均勻的總體二、類型抽樣.含義:先將全及總體中的所有單位按某一主要標志分組,然后在各組中采用純隨機抽 樣或機械抽樣方
17、式,抽取一定數目的調查單位構成所需的樣本。又叫分層抽樣或分類抽 樣。.方法:A比例分配法n i/n=Ni/NB最佳分配法 根據各層單位的變異程度的大小來分配C經濟分配法 除了考慮單位數目和變異程度外,還有調查費用。.特點:能保證分布的均勻性,提高樣本的代表性,誤差較小;能同時推斷總體指標和 各子總體的指標二、機械抽樣.含義:是先將全及總體所有單位按某一標志順序編號排列,然后按照固定順序和相等 的空間距離或間隔,從中抽取樣本單位的一種抽樣組織方式。又叫等距抽樣或系統抽樣。.方法:根據需要計算抽取各個樣本單位之間的距離或間隔;然后,按此間隔依次抽取 必要的樣本單位。.特點:能保證樣本較均勻地分布。是不重復的抽樣。4.形式:按無關標志排隊,具抽樣效果相當于簡單隨機抽樣;按有關標志排隊,其抽樣 效果相當于類型抽樣。四、整群抽樣.含
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行保安考試試題及答案
- 音樂教育考試試題及答案
- 六一公司月會活動方案
- 六一畢業活動方案
- 六一活動外賣活動方案
- 六一活動氣球活動方案
- 六一活動裝飾畫活動方案
- 六一豬肉店活動方案
- 六一航天活動方案
- 六一節家庭活動方案
- 重慶萬州區社區工作者招聘筆試真題2024
- 酒店項目規劃設計方案(模板)
- 2025名著導讀《鋼鐵是怎樣煉成的》閱讀習題(含答案)
- 2025-2030中國冷熱交換器行業市場現狀分析及競爭格局與投資發展研究報告
- ICU經口氣管插管患者口腔黏膜壓力性損傷預防的最佳證據總結 - 學習與臨床應用
- 陜09J01 建筑用料及做法圖集
- CATIA在汽車底盤設計中的應用
- 【簡譜】親愛的旅人啊簡譜
- 現代護理管理工具的應用.ppt
- 上海市基本醫療保險結算項目庫動態維護細則
- 灼燙事故應急演練方案
評論
0/150
提交評論