統計學第7章參數估計_第1頁
統計學第7章參數估計_第2頁
統計學第7章參數估計_第3頁
統計學第7章參數估計_第4頁
統計學第7章參數估計_第5頁
已閱讀5頁,還剩81頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章參數估計PowerPoint統計學第七章參數估計§7.1

參數估計的一般問題§7.2一個總體參數的區間估計§7.3兩個總體參數的區間估計§7.4樣本容量的確定參數估計在統計方法中的地位參數估計假設檢驗統計方法描述統計推斷統計統計推斷的過程樣本總體樣本統計量例如:樣本均值、比例、方差總體均值、比例、方差等§7.1參數估計的一般問題估計量與估計值點估計與區間估計估計量與估計值估計量與估計值估計量:用于估計總體參數的隨機變量如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量參數用表示,估計量用表示估計值:估計參數時計算出來的統計量的具體值如果樣本均值x

=80,則80就是的估計值估計量的優劣標準對于同一個未知參數,不同的方法得到的估計量可能不同,于是提出問題應該選用哪一種估計量?用何標準來評價一個估計量的好壞?常用標準(1)無偏性(3)一致性(2)有效性無偏性

(unbiasedness)無偏性:估計量抽樣分布的數學期望等于被估計的總體參數P(

)BA無偏有偏有效性

(efficiency)有效性:對同一總體參數的兩個無偏點估計量,有更小標準差的估計量更有效

AB

的抽樣分布

的抽樣分布P(

)估計量的優劣標準(續)假設

為的無偏估計量。盡管A的抽樣分配會集中于,但并不代表中的任何特定值皆剛好等于。一個好的估計量除了抽樣分布隆迪要集中于總體參數外,其抽樣分布的標準差要愈小愈好。一個總體參數可以有很多個不同的無偏估計量,如隨機變量為對稱分配時,樣本平均數與樣本中位數皆為無偏估計量,但我們喜歡比較集中的估計量。相合性

(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數AB較小的樣本容量較大的樣本容量P(

)參數估計的方法估計方法點估計區間估計假設你想得知大學商學院一年級(整體)學生個人使用每月的零用金情形。你該如何得到呢?參數估計的類型——點估計、區間估計Mean,,isunknownPopulationRandomSampleIam95%confidentthatisbetween400&600.MeanX=500Sample點估計

(pointestimate)用樣本的估計量直接作為總體參數的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計2. 沒有給出估計值接近總體參數程度的信息區間估計

(intervalestimate)在點估計的基礎上,給出總體參數估計的一個區間范圍,該區間由樣本統計量加減抽樣誤差而得到的根據樣本統計量的抽樣分布能夠對樣本統計量與總體參數的接近程度給出一個概率度量比如,某班級平均分數在75~85之間,置信水平是95%

樣本統計量

(點估計)置信區間置信下限置信上限區間估計的圖示X95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x將構造置信區間的步驟重復很多次,置信區間包含總體參數真值的次數所占的比例稱為置信水平表示為(1-為是總體參數未在區間內的比例常用的置信水平值有99%,95%,90%相應的為0.01,0.05,0.10置信水平由樣本統計量所構造的總體參數的估計區間稱為置信區間用一個具體的樣本所構造的區間是一個特定的區間,我們無法知道這個樣本所產生的區間是否包含總體參數的真值我們只能是希望這個區間是大量包含總體參數真值的區間中的一個,但它也可能是少數幾個不包含參數真值的區間中的一個置信區間

(confidenceinterval)區間估計(續)理解置信區間置信區間與置信水平均值的抽樣分布(1-)%區間包含了

%的區間未包含1-aa/2a/2區間估計(續)影響區間寬度的因素1. 總體數據的離散程度,用來測度樣本容量,置信水平(1-),影響z的大小。。。。。。§7.2一個總體參數的區間估計總體均值的區間估計總體比例的區間估計總體方差的區間估計一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差總體均值的區間估計

(正態總體、2已知,或非正態總體、大樣本)總體均值的區間估計

(大樣本)1. 假定條件總體服從正態分布,且方差(2)

已知如果不是正態分布,可由正態分布來近似(n

30)使用正態分布統計量Z總體均值在1-置信水平下的置信區間為總體均值的區間估計

(例題分析)【例】一家食品生產企業以生產袋裝食品為主,為對產量質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10克。試估計該批產品平均重量的置信區間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區間估計

(例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:

總體均值在1-置信水平下的置信區間為該食品平均重量的置信區間為101.44克~109.28克之總體均值的區間估計

(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數據如下表。試建立投保人年齡90%的置信區間36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區間估計

(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為投保人平均年齡的置信區間為37.37歲~41.63歲總體均值的區間估計

(正態總體、2未知、小樣本)總體均值的區間估計

(小樣本)1. 假定條件總體服從正態分布,且方差(2)

未知小樣本(n<30)使用t

分布統計量總體均值在1-置信水平下的置信區間為t分布

分布是類似正態分布的一種對稱分布,它通常要比正態分布平坦和分散。隨著n的增大,分布也逐漸趨于正態分布Xt

分布與標準正態分布的比較t分布標準正態分布t不同自由度的t分布標準正態分布t(df=13)t(df=5)Z總體均值的區間估計

(例題分析)【例】已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區間16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470總體均值的區間估計

(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為該種燈泡平均使用壽命的置信區間為1476.8小時~1503.2小時單個總體均值的區間估計(續)思考科學上的發現往往是由年輕人作出的。下面列出了自十六世紀中葉至二十世紀早期的十二項重大發現的發現者和他們發現時的年齡要求95%置信水平估計取得重大科學發現的平均年齡。單個總體均值的區間估計(續)發現發現者發現日期年齡地球繞太陽運轉哥白尼154340望遠鏡、天文學的基本定律伽利略160034運動原理、重力、微積分牛頓166523電的本質富蘭克林174640燃燒是與氧氣聯系著的拉瓦錫177431地球是漸進過程深化成的萊爾183033自然選擇控制演化的達爾文185849光的場方程麥克斯韋186433放射性居里189634量子論普朗克190143狹義相對愛因斯坦190526量子論的數學基礎薛定諤192639總體比例的區間估計總體比例的區間估計1. 假定條件總體服從二項分布大樣本下可以由正態分布來近似使用正態分布統計量Z3.總體比例在1-置信水平下的置信區間為總體比例的區間估計

(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區間為55.65%~74.35%

單總體比率的區間估計(續)思考隨機抽取400位大學應屆畢業同學,得到共有32人同學考上了研究生。試求讀研同學所占百分比的95%置信區間。單總體比率的區間估計(續)單總體的方差估計方差估計假設總體服從正態分布總體方差2

的點估計量為S2,且總體方差在1-置信水平下的置信區間為單總體的方差估計(續)221-2總體方差1-的置信區間自由度為n-1的2單總體的方差估計(續)例解一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表7所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3單總體的方差估計(續)解:已知n=25,1-=95%,根據樣本數據計算得s2=93.21

2置信度為95%的置信區間為該企業生產的食品總體重量標準差的的置信區間為7.54克~13.43克5.4兩個總體的區間估計總體參數符號表示樣本統計量均值之差比例之差方差比

m1s1總體1s2

m2總體2抽取簡單隨機樣樣本容量n1計算X1抽取簡單隨機樣樣本容量n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布兩個總體均值之差的估計大樣本假定條件兩個總體都服從正態分布,12、22已知若不是正態分布,可以用正態分布來近似(n130和n230)兩個樣本是獨立的隨機樣本用正態分布統計量Z兩個總體均值之差的估計(續)12、22已知時,兩個總體均值之差1-2在1-置信水平下的置信區間為12、22未知時,兩個總體均值之差1-2在1-置信水平下的置信區間為兩個總體均值之差的估計(續)例解某地區教育委員會想估計兩所中學的學生高考時的英語平均分數之差,為此在兩所中學獨立地抽取兩個隨機樣本,有關數據如下表。建立兩所中學高考英語平均分數之差95%的置信區間

兩個樣本的有關數據

中學1中學2n1=46n1=33S1=5.8S2=57.2兩個總體均值之差的估計(續)解:兩個總體均值之差在1-置信水平下的置信區間為兩所中學高考英語平均分數之差的置信區間為5.03分~10.97分兩個總體均值之差的估計(續)獨立小樣本(12=22

)假定條件兩個總體都服從正態分布兩個總體方差未知但相等:12=22兩個獨立的小樣本(n1<30和n2<30)總體方差的合并估計量估計量X1-X2的抽樣標準差兩個總體均值之差的估計(續)兩個樣本均值之差的標準化兩個總體均值之差1-2在1-置信水平下的置信區間為兩個總體均值之差的估計(續)例解:為估計兩種方法組裝產品所需時間的差異,分別對兩種不同的組裝方法各隨機安排12個工人,每個工人組裝一件產品所需的時間(分鐘)下如表。假定兩種方法組裝產品的時間服從正態分布,且方差相等。試以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區間兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5兩個總體均值之差的估計(續)解:根據樣本數據計算得合并估計量為:兩種方法組裝產品所需平均時間之差的置信區間為0.14分鐘~7.26分鐘兩個總體均值之差的估計(續)獨立小樣本(1222

)假定條件兩個總體都服從正態分布兩個總體方差未知且不相等:1222兩個獨立的小樣本(n1<30和n2<30)使用統計量兩個總體均值之差的估計(續)兩個總體均值之差1-2在1-置信水平下的置信區間為自由度兩個總體均值之差的估計(續)例解:假定第一種方法隨機安排12個工人,第二種方法隨機安排8個工人,即n1=12,n2=8,所得的有關數據如表。假定兩種方法組裝產品的時間服從正態分布,且方差不相等。以95%的置信水平建立兩種方法組裝產品所需平均時間差值的置信區間兩個方法組裝產品所需的時間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2兩個總體均值之差的估計(續)解:根據樣本數據計算得自由度為:兩種方法組裝產品所需平均時間之差的置信區間為0.192分鐘~9.058分鐘兩個總體均值之差的估計(續)兩個總體均值之差的估計(匹配大樣本)假定條件兩個匹配的大樣本(n130和n230)兩個總體均值之差d=1-2在1-置信水平下的置信區間為使用統計量對應差值的均值對應差值的標準差兩個總體均值之差的估計(續)兩個總體均值之差的估計(匹配小樣本)假定條件兩個匹配的大樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態分布兩個總體均值之差d=1-2在1-置信水平下的置信區間為兩個總體均值之差的估計(續)例解由10名學生組成一個隨機樣本,讓他們分別采用A和B兩套試卷進行測試,結果如下表。試建立兩種試卷分數之差d=1-295%的置信區間10名學生兩套試卷的得分學生編號試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916兩個總體均值之差的估計(續)解:根據樣本數據計算得兩種試卷所產生的分數之差的置信區間為6.33分~15.67分兩個總體比率之差的估計比率之差假定條件兩個總體服從二項分布可以用正態分布來近似兩個樣本是獨立的兩個總體比例之差1-2在1-置信水平下的置信區間為兩個總體比率之差的估計(續)例解:在某部韓劇的收視率調查中,男性隨機調查了400人,有32%的人收看了該節目;女性隨機調查了500人,有45%的人收看了該節目。試以90%的置信水平估計男女收視率差別的置信區間

兩個總體比率之差的估計(續)解:已知

n1=500,n2=400,p1=45%,p2=32%,

1-=95%,Z/2=1.96

1-2置信度為95%的置信區間為

男女收視率差值的置信區間為6.68%~19.32%兩個總體比率之差的估計(續)兩個總體方差比的區間估計比較兩個總體的方差比用兩個樣本的方差比來判斷如果S12/S22接近于1,說明兩個總體方差很接近如果S12/S22遠離1,說明兩個總體方差之間存在差異總體方差比在1-置信水平下的置信區間為兩個總體比率之差的估計(續)FF1-F總體方差比1-的置信區間方差比置信區間示意圖兩個總體比率之差的估計(續)例解:為了研究男女學生在生活費支出(元)上的差異,在某大學各隨機抽取25名男學生和25名女學生,得到下面的結果:男學生:女學生:試以90%置信水平估計男女學生生活費支出方差比的置信區間兩個總體比率之差的估計(續)解:根據自由度

n1=25-1=24,n2=25-1=24,查得F/2(24)=1.98,F1-/2(24)=1/1.98=0.50512/22置信度為90%的置信區間為男女學生生活費支出方差比的置信區間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論