大學統計學第7章 參數估計_第1頁
大學統計學第7章 參數估計_第2頁
大學統計學第7章 參數估計_第3頁
大學統計學第7章 參數估計_第4頁
大學統計學第7章 參數估計_第5頁
已閱讀5頁,還剩64頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7章參數估計第7章參數估計7.1

參數估計的一般問題7.2一個總體參數的區間估計7.3兩個總體參數的區間估計7.4樣本容量的確定7.1參數估計的一般問題7.1.1估計量與估計值7.1.2點估計與區間估計7.1.3評價估計量的標準估計量:用于估計總體參數的統計量的名稱如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量參數用表示,估計量用表示估計值:估計參數時計算出來的統計量的具體值如果樣本均值x

=80,則80就是的估計值估計量與估計值

(estimator&estimatedvalue)參數估計的方法估計方法點估計區間估計點估計(pointestimate)用樣本的估計量的某個取值直接作為總體參數的估計值

無法給出估計值接近總體參數程度的信息雖然在重復抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值評價估計量的標準無偏性有效性一致性無偏性(unbiasedness)

無偏性估計量抽樣分布的數學期望等于被估計的總體參數P(

)BA無偏有偏有效性(efficiency)有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效

AB

的抽樣分布

的抽樣分布P(

)一致性(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數AB較小的樣本容量較大的樣本容量P(

)區間估計(intervalestimate)在點估計的基礎上,給出總體參數估計的一個區間范圍,該區間由樣本統計量加減估計誤差而得到根據樣本統計量的抽樣分布能夠對樣本統計量與總體參數的接近程度給出一個概率度量比如,某班級平均分數在60~80之間,置信水平是95%

區間估計的基本要素包括:樣本點估計值、抽樣極限誤差、估計的可靠程度樣本點估計值抽樣極限誤差:也稱邊際誤差,可允許的誤差范圍。抽樣估計的可靠程度(置信度、置信水平)區間估計(intervalestimate)參數區間估計的含義:估計總體參數的區間范圍,并給出區間估計成立的概率值。其中:1-α(0<α<1)稱為置信度;α是區間估計的顯著性水平,其取值大小由實際問題確定,經常取1%、5%和10%。注間對上式的理解:例如抽取了1000組樣本,根據每一組樣本均構造了一個置信區間,,這樣,由1000組樣本構造的總體參數的1000個置信區間中,有95%的區間包含了總體參數的真值,而5%的置信區間則沒有包含。這里,95%這個值被稱為置信水平(或置信度)。一般地,將構造置信區間的步驟重復很多次,置信區間包含總體參數真值的次數所占的比例稱為置信水平。區間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x區間估計的圖示x95%的樣本-1.96x+1.96x置信區間與置信水平

均值的抽樣分布(1-)區間包含了1–a

a/2a/2比例為1-α的樣本均值會落在總體均值μ兩側的范圍內。也就是,比例為1-α的樣本均值構造的置信區間,會包含總體均值μ。常用置信水平的值置信水平αα/290%0.10.051.6595%0.050.0251.9699%0.010.0052.58影響區間寬度的因素

中,是點估計值,是邊際誤差1. 總體數據的離散程度,用來測度樣本容量置信水平(1-),影響z的大小7.2一個總體參數的區間估計7.2.1總體均值的區間估計7.2.2總體比例的區間估計7.2.3總體方差的區間估計一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差總體均值的區間估計

(正態總體、2已知,或非正態總體、大樣本)總體均值的區間估計

(大樣本)1. 假定條件總體服從正態分布,且方差(2)

已知總體服從正態分布,且方差(2)

未知,大樣本如果不是正態分布,可由正態分布來近似(n

30)使用正態分布統計量z總體均值在1-置信水平下的置信區間為總體均值的區間估計

(正態總體、2未知、小樣本)總體均值的區間估計(小樣本)1. 假定條件總體服從正態分布,但方差(2)

未知小樣本(n<30)使用t

分布統計量總體均值在1-置信水平下的置信區間為小結總體正態?n≥30?σ2已知?否是是否否是根據中心極限定理得到的近似結果。

σ未知時用s來估計。增大n?數學變換?總體比例的區間估計總體比例的區間估計1.

假定條件總體服從二項分布可以由正態分布來近似使用正態分布統計量z3.總體比例在1-置信水平下的置信區間為總體方差的區間估計總體方差的區間估計

(圖示)221-2總體方差1-的置信區間自由度為n-1的2總體方差的區間估計1. 估計一個總體的方差或標準差2. 假設總體服從正態分布3.總體方差2

的點估計量為s2,且4.

總體方差在1-置信水平下的置信區間為總體均值的區間估計

(例題分析)【例】一家食品生產企業以生產袋裝食品為主,為對產量質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量(單位:g)如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區間估計

(例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:。由于是正態總體,且方差已知。總體均值在1-置信水平下的置信區間為在95%的置信度下,該食品平均重量的置信區間為101.44g~109.28g總體均值的區間估計

(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數據如下表。試建立投保人年齡90%的置信區間36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區間估計

(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為在90%的置信度下,投保人平均年齡的置信區間為37.37歲~41.63歲總體均值的區間估計

(例題分析)【例】已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區間16只燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470總體均值的區間估計

(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為該種燈泡平均使用壽命的置信區間為1476.8h~1503.2h總體比例的置信區間:例子解:顯然有因此可以用正態分布進行估計。Z/2=1.645結論:我們有90%的把握認為悉尼青少年中每天都抽煙的青少年比例在19.55%~23.85%之間。1986年對悉尼995名青少年的隨機調查發現,有216人每天都抽煙。試估計悉尼青少年中每天都抽煙的青少年比例的90%的置信區間。

p(1-p)總體方差的區間估計

(例題分析)【例】一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間25袋食品的重量單位:g112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體方差的區間估計

(例題分析)解:已知n=25,1-=95%,根據樣本數據計算得

s2=93.21

2置信度為95%的置信區間為該企業生產的食品總體重量標準差的的置信區間為7.54g~13.43g一個總體參數的區間估計

(小結)待估參數均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布7.3兩個總體參數的區間估計7.3.1兩個總體均值之差的區間估計7.3.2兩個總體比例之差的區間估計7.3.3兩個總體方差比的區間估計兩個總體均值之差的區間估計

(獨立大樣本)兩個總體均值之差的估計

(大樣本)1. 假定條件兩個總體都服從正態分布,12,

22已知若不是正態分布,可以用正態分布來近似(n130和n230)兩個樣本是獨立的隨機樣本使用正態分布統計量z兩個總體均值之差的估計

(大樣本)1. 12,22已知時,兩個總體均值之差1-2在1-置信水平下的置信區間為12,22未知時,兩個總體均值之差1-2在1-置信水平下的置信區間為兩個總體均值之差的區間估計

(獨立小樣本,總體方差未知)兩個總體均值之差的估計

(小樣本:

12=22

)1. 假定條件兩個總體都服從正態分布兩個總體方差未知但相等:12=22兩個獨立的小樣本(n1<30和n2<30)總體方差的合并估計量2.估計量x1-x2的抽樣標準差兩個總體均值之差的估計

(小樣本:12=22

)兩個樣本均值之差的標準化兩個總體均值之差1-2在1-置信水平下的置信區間為兩個總體均值之差的估計

(小樣本:1222

)1. 假定條件兩個總體都服從正態分布兩個總體方差未知且不相等:1222兩個獨立的小樣本(n1<30和n2<30)使用統計量兩個總體均值之差的估計

(小樣本:1222

)兩個總體均值之差1-2在1-置信水平下的置信區間為自由度兩個總體均值之差的區間估計

(匹配樣本)兩個總體均值之差的估計

(例題分析)【例】為估計兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12名工人,每個工人組裝一件產品所需的時間(單位:min)如下表。假定兩種方法組裝產品的時間服從正態分布,且方差相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區間兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個總體均值之差的估計

(匹配小樣本)假定條件兩個匹配的小樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態分布

兩個總體均值之差d=1-2在1-置信水平下的置信區間為兩個總體比例之差區間的估計1. 假定條件兩個總體服從二項分布可以用正態分布來近似兩個樣本是獨立的2. 兩個總體比例之差1-2在1-置信水平下的置信區間為兩個總體比例之差的區間估計兩個總體比例之差的估計

(例題分析)【例】在某個電視節目的收視率調查中,農村隨機調查了400人,有32%的人收看了該節目;城市隨機調查了500人,有45%的人收看了該節目。試以95%的置信水平估計城市與農村收視率差別的置信區間12兩個總體比例之差的估計

(例題分析)解:

已知

n1=500,n2=400,p1=45%,p2=32%,

1-=95%,z/2=1.96

1-2置信度為95%的置信區間為城市與農村收視率差值的置信區間為6.68%~19.32%兩個總體方差比的區間估計兩個總體方差比的區間估計

(圖示)FF1-F總體方差比1-的置信區間方差比置信區間示意圖兩個總體方差比的區間估計1. 比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/S22接近于1,說明兩個總體方差很接近如果S12/S22遠離1,說明兩個總體方差之間存在差異總體方差比在1-置信水平下的置信區間為兩個總體方差比的區間估計

(例題分析)【例】為了研究男女學生在生活費支出(單位:元)上的差異,在某大學各隨機抽取25名男學生和25名女學生,得到下面的結果

男學生:女學生:

試以90%置信水平估計男女學生生活費支出方差比的置信區間兩個總體方差比的區間估計

(例題分析)解:根據自由度

n1=25-1=24,n2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論