




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第八章 參數統計估計什么是抽樣統計估計?什么是抽樣統計估計? The purpose of Statistics inference is to obtain information about a population from information contained in sample. 例例1 一汽車輪胎制造商生產一種被認為壽命更長的新型輪胎。120個個樣本樣本測試平均里程:36,500公里推斷新輪胎新輪胎平均壽命平均壽命:36,500公里400個樣本 支持人數:160推斷支持該候選人的選民支持該候選人的選民占全部選民的比例:占全部選民的比例:160/400=40%例例2:某黨派想支
2、持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領導需要估計支持該候選人的民眾支持該候選人的民眾占全部登記投票人總數的比例占全部登記投票人總數的比例。由于時間及財力的限制: 抽樣估計方法主要用在下列兩種情況抽樣估計方法主要用在下列兩種情況: 注意:注意: 抽樣估計只得到對總體特征的近似測度,因此,抽樣估計還必須同時考察所得結果的“可能范圍可能范圍” 與“可靠程度可靠程度”。 1、對所考查的總體不可能進行全部測度; 2、從理論上理論上說可以對所考查的總體進行全部測度,但實踐上實踐上由于人力、財力、時間等方面的原因,無法(不劃算)進行全部測度。第一節 點估計1.用樣本的估計量直接作為
3、總體參數的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計2.缺點:沒有給出估計值接近總體參數程度的信息3.點估計的方法:1.矩估計法(重點)2.最大似然法3.順序統計量法4.最小二乘法等點估計:矩估計方法兩個概念:K階原點距:K階中心距:舉例: 即為均值; kikxn()kikxxn11022續點估計:矩估計方法在點估計中,我們用樣本統計值作為總體參數的估計值。即以 作為總體均值的點估計值,以樣本比例 p 作為總體的比例P點估計值。矩估計方法:一個例子例:圣安德魯大學每年接受900份入學申請,申請表含學生學術能力測試成績、學生是否希望學校提供住宿
4、等信息。招生主管希望知道申請學生學術能力測試的平均成績及希望由學校提供住宿的學生的比例。本例中,我們有三種方法可以得到相關信息:對900名申請者作普查;用隨機數表選取容量為30的隨機樣本。對總體研究可以得到以下總體參數:抽樣而得的樣本數據 RandomNo. Number Applicant SAT Score On-Campus 1 744 Connie Reyman 1025 Yes 2 436 William Fox 950 Yes 3 865 Fabian Avante 1090 No 4 790 Eric Paxton 1120 Yes 5 835 Winona Wheeler 10
5、15 No . . . . . 30 685 Kevin Cossack 965 No 點估計 作為作為 的點估計的點估計 s 作為作為 的點估計的點估計 作為作為 p 的點估計的點估計 上述估計總體參數的過程被稱為點估計點估計(point estimation); 樣本均值(標準差/比例)稱為總體均值(標準差/比例)的點估計量點估計量(point estimator); 樣本均值(標準差/比例)的具體數值稱為總體均值(標準差/比例)的點估計值點估計值(point estimate)。 由于點估計量是由樣本測算的,因此也稱為樣本樣本統計量。統計量。補充:點估計的兩種方法 點估計也叫定值估計,就
6、是直接以一個樣本估計量 來估計總體參數.其常用的估計方法有以下兩種:矩估計法矩估計法極大似然估計法極大似然估計法 (一)矩估計法 1、基本思想 由于樣本來源于總體,樣本矩在一定程度上反映了總體矩,而且由大數定律可知,樣本矩依概率收斂于總體矩。因此,只要總體X的k階原點矩存在,就可以用樣本矩作為相應總體矩的估計量,用樣本矩的函數作為總體矩的函數的估計量。按矩估計法,樣本均值 是總體均值的點估計量,樣本方差s2是總體方差 2的點估計量,樣本比例p是總體比例P的點估計量。x2、計算公式(m為樣本中具有某中屬性的單位數)nmppxxnsxxnsxnxniiniinii)(1)(111212221 (二
7、)極大似然估計法1、基本思想 設總體分布的函數形式已知,但有未知參數 , 可以取很多值,在的一切可能取值中選一個使樣本觀察值出現的頻率為最大的值作為的估計值,記作 ,并稱為 的極大似然估計值。這種求估計值的方法稱為極大似然估計法。2、概念 設總體X的概率密度函數為 f(x; ) ,其中為待估計參數。 對于從總體中取得的樣本觀察值x1,x2,xn,其聯合密度函數為 ,它是參數 的函數,我們稱之為的似然函數,記為L(): 極大似然估計法就是尋求使得函數L()達到極大的作為該參數的估計量,記為 ,并稱 為參數的極大似然估計(記為MLE)。用微分法解出似然方程,就得到的極大似然估計。),(1niixf
8、);()(1niixfL 用樣本統計量樣本統計量(sample statistics)可以作為其對應的總體的點估計量點估計量(point estimator)。 但要估計總體的某一指標,并非只能用一個樣本指標,而可能有多個指標可供選擇,即對同一總體參數,可能會有不同的估計量。點估計量的性質:估計量優劣的衡量點估計量的性質:估計量優劣的衡量 作為一個一個好的點估計量好的點估計量,統計量必須具有如下性質: 無偏性、有效性、一致性無偏性、有效性、一致性1、無偏性 是指樣本估計量的均值應等于被估計總體參數的真值,即)(E3、一致性、一致性 也稱相合性,是指隨著樣本容量的增大,估計量越來越接近被估計的總
9、體參數第二節第二節 區間估計區間估計x (一)樣本平均數的抽樣分布(一)樣本平均數的抽樣分布 (Sampling Distribution of ) 考察樣本均值的概率分布形式樣本均值的概率分布形式。分兩種況: 1)總體分布已知且為正態分布總體分布已知且為正態分布; 2)總體分布未知;總體分布未知; 1、樣本均值抽樣分布的形狀、樣本均值抽樣分布的形狀(1)當總體分布已知且為正態分布或接近正態分布時,則無論樣本容量大小如何,樣本均值則無論樣本容量大小如何,樣本均值都為正態分布都為正態分布。 (2)當總體分布未知時,需要用到Central limit Theorem) 對容量為對容量為n 的簡單隨
10、機樣本,樣本均值的分布的簡單隨機樣本,樣本均值的分布隨樣本容量的增大而趨于隨樣本容量的增大而趨于正態分布正態分布。 經驗上驗證經驗上驗證,當樣本容量等于或大于30時,無論總體的分布如何,樣本均值的分布則非常接近正態分布。 因此統計上常稱容量在30(含30)以上的樣本為大樣本大樣本(large-sample-size)。)(xE可證明在簡單隨機抽樣中 2、樣本均值抽樣分布的數值特征、樣本均值抽樣分布的數值特征 n=樣本容量; N=總體單位個數可以證明可以證明樣本均值的標準差樣本均值的標準差:1)(NnN有限總體:無限總體:稱為有限總體修正因子有限總體修正因子(finite population
11、correction factor)。 由于樣本標準差樣本標準差與總體標準差總體標準差及樣本容量樣本容量有關:nx 4、樣本容量與樣本均值分布的關系、樣本容量與樣本均值分布的關系因此,樣本容量增大,樣本均值標準差變小樣本容量增大,樣本均值標準差變小,從而使樣本分布峰度變高,于是在相同區間內,概率分布線下的面積變大,提高了樣本均值落在該區間的可能性。 注意注意: 1、所有可能的樣本均值的平均數等于總體均值,而與樣本容量無關。 2、點估計往往是在總體方差已知的情況下進行的。 在經濟與商務的許多場合,需要用樣本比例p對總體比例P進行統計推斷。 (二二)樣本比例的抽樣分布樣本比例的抽樣分布(Sampl
12、ing Distribution of p) 樣本比例抽樣分布的相關信息樣本比例抽樣分布的相關信息: p的:期望值、標準差、抽樣分布形狀 樣本比例的抽樣分布樣本比例的抽樣分布是樣本比例所有可能值的是樣本比例所有可能值的概率分布。概率分布。 The sampling distribution of p is the probability distribution of all possible values of the sample proportion p. 1、期望值、期望值(Expected value of p):):E (p)=P有限總體:有限總體:無限總體無限總體 2、標準差、標
13、準差(Standard deviation of p):): 3、樣本比例抽樣分布的形狀、樣本比例抽樣分布的形狀(Form of the sampling distribution of p) 根據中心極限定理中心極限定理有:當樣本容量增大時當樣本容量增大時(大樣本),樣本比例抽樣分布趨向于以樣本(大樣本),樣本比例抽樣分布趨向于以樣本期望值為中心、以樣本方差為方差的正態分布期望值為中心、以樣本方差為方差的正態分布。 一、抽樣誤差(一、抽樣誤差(Sampling Error) 一個樣本可以得到總體參數的一個點估計,該點估計值與總體參數真值之間的差異,即為抽樣誤抽樣誤差差。有三個相互聯系的概念:
14、 (一)實際抽樣誤差:(一)實際抽樣誤差: 二二 抽樣誤差與區間估計抽樣誤差與區間估計)( (二)抽樣平均誤差:(二)抽樣平均誤差: 所有可能樣本估計值與相應總體參數的平均差異程度: (三(三)抽樣極限誤差抽樣極限誤差注意注意: 1、統計學上往往用、統計學上往往用抽樣極限誤差抽樣極限誤差來測度抽來測度抽樣誤差的大小或者說測度點估計的精度。樣誤差的大小或者說測度點估計的精度。 原因:原因:總體參數值往往并不知道,因此,實際抽樣誤差與抽樣平均誤差也往往無法求出,但在抽樣分布大體知道的情況下,抽樣極限誤差是可以估計出來的。 一定概率下抽樣誤差的可能范圍(也稱允許誤差): 2、抽樣極限誤差的估計總是要
15、和一定的概率保、抽樣極限誤差的估計總是要和一定的概率保證程度聯系在一起的。證程度聯系在一起的。 原因:原因:樣本統計量往往是一隨機變量,它與總體參數真值之差也是一個隨機變量,因此就不能期望某次抽樣的樣本估計值落在一定區間內是一個必然事件,而只能給予一定的概率保證。 因此,在進行抽樣估計時,既需要考慮抽樣誤在進行抽樣估計時,既需要考慮抽樣誤差的差的可能范圍可能范圍,同時還需考慮落到這一范圍的,同時還需考慮落到這一范圍的概率概率大小大小。 前者是估計的準確度估計的準確度問題,后者是估計的可靠估計的可靠性性問題,兩者緊密聯系不可分開。這也正是區間估計所關心的主要問題。 點估計點估計是通過樣本估計量的
16、某一次估計值來推斷總體參數的可能取值; 區間估計區間估計則是根據樣本估計量以一定的可靠程度推斷總體參數所在的區間范圍。 如果抽樣分布已知如果抽樣分布已知,則在點估計中,可以知道抽樣的點估計值與總體參數的離差在某一給定范圍內的概率大小,即以一定的可靠程度知道以下抽樣極限誤差: 二、區間估計(二、區間估計(Interval Estimation) 因此,容易得到在抽樣中,總體參數將以同樣 的可能性(概率)存在于下面的區間內: 一般地,設總體參數為, L、 U為由樣本確定的兩個統計量值,對于給定的(0 =30),不論總體分布形式如何,均可用上述方法進行總體均值的區間估計,這時,如果總體方差未知,則直
17、接用樣本方差代替。 注意:注意:總體均值的區間估計(例題分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區間估計(例題分析)總體均值的區間估計(例題分析)36個投保人年齡的數據個投保人年齡的數據 233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區間估計(例
18、題分析) 2、小樣本下總體方差未知時,正態分布總體、小樣本下總體方差未知時,正態分布總體均值的區間估計均值的區間估計 如果是小樣本,但總體為正態分布,在總體方差未知如果是小樣本,但總體為正態分布,在總體方差未知而需用樣本方差代替時,則下式而需用樣本方差代替時,則下式服從自由度為服從自由度為n-1n-1的的t t分布分布。00.050.10.150.20.250.30.350.40.45-3-2.4-1.8-1.2-0.600.61.21.82.43Zt 注意:注意: 如果小樣本下總體分布非正態,則無法進行區間估計,唯一的解決方法就是增大樣本。從而可得置信度為1- 時總體均值的置信區間:或 于是,給定置信度為1- ,可由t分布表查得臨界值t /2(n-1),使得總體均值的區間估計(例題分析)16燈泡使用壽命的數據燈泡使用壽命的數據 1510152014801500145014801510152014801490153015101460146014701470總體均值的區間估計(例題分析)總體均值區間估計程序總體均值區間估計程序n=30?知否?nzx2用s代替nszx2總體是否接近正太分布?知否?nzx2用s代替nstx2增大樣本容量至n=30yesNoyesNoyesyesNoNo 在大樣本下大樣本下,樣本比
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電力設備故障排除及售后服務協議
- 智能家居服務采購合同(家庭智能管家系統)
- 建筑設計與施工過程中的風險控制
- 智能倉儲物流采購合同范本
- 公司籃球友誼賽策劃方案
- 公司游樂園團建活動方案
- 茶葉批發市場租賃購銷合同
- 廣告行業中的文化創意元素分析研究
- 車輛保險理賠服務協議:汽車保險理賠代理合同
- 公司檔案搬運策劃方案
- 行業特定市場調研方法與技巧分享
- 2025年高考數學全國二卷試題真題解讀及答案詳解
- 大骨節考試題及答案
- 2025年小學五年級數學期末沖刺卷:數學基礎知識鞏固
- CSCO惡性血液病診療指南(2025)解讀
- T/CHTS 20036-2023公路橋梁用硬聚氯乙烯聲測管
- 《動物保定技術》課件
- 北京市朝陽區2023-2024學年四年級下學期語文期末考試卷(含答案)
- 上樣合作協議合同協議
- 公司2025慶七一活動方案七一活動方案2025
- 留學機構合作協議書范本
評論
0/150
提交評論