第七章參數估計53056_第1頁
第七章參數估計53056_第2頁
第七章參數估計53056_第3頁
第七章參數估計53056_第4頁
第七章參數估計53056_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第七章參數估計基本要求掌握點估計的幾種常用方法,了解無偏性、一致性、有效性是評價估計量好壞的標準,理解置信區間的概念和含義,會計算一些不同情況的區間估計。重點 參數的區間估計難點總體均值與方差的置信區間求法。引言 統計推斷就是利用樣本資料信息對總體作推斷,由于信息的有限性,樣本的隨機性,做出的推斷不可能絕對準確,這種不確定性可用概率大小來衡量。例如,某批產品的次品率是個未知數,可以從中抽取100件,如有5件次品,則這100件產品的次品率為,可以用樣品的次品率作為整批產品次品率的估計。又如,某地成年人的身高,可隨機抽取個成年人,這個成年人的平均身高可作為該地成年人平均身高的估計。參數估計 在已知

2、總體分布的類型時,總體分布中的一些參數往往未知,利用樣本的資料信息來估計總體分布中的一些未知參數(平均值、標準差、比率等)。第一節參數的點估計引例 某地水稻面積為10000畝,隨機抽取4塊稻田,畝產分別為300,350,400,450,求該地平均畝產量及總產量的估計。設平均畝產量,樣本均值,平均畝產量估計,總產量的估計。由于樣本的隨機性,的具體值不同,就存在一個估計“好壞”的標準,即要求保證估計量有較大的概率取值在被估計參數的附近,而且估計量的方差盡量小。點估計 設總體的分布函數為,其中是一個未知的數或一個向量。若總體樣本,,構造一個統計量,作為參數的估計,稱T為的估計量,記作,即,它是一個隨

3、機變量。是樣本,的一個觀測值,將代入中得到T的具體數值,稱為的估計值。同一個未知參數可用不同的方法求得其估計量。點估計的步驟 (1)構造統計量以此作為的估計量;(2)評價估計量的好壞。一、矩法估計階樣本原點矩;階樣本中心矩 ()階總體原點矩;階總體中心矩(為正整數)方法 樣本矩作為總體矩的估計量。理論背景:樣本,是獨立同分布,因而,也是獨立同分布,由大數定律知,(依概率)所以對充分大的,有由于中心矩可用原點矩表示,所以只討論原點矩。設為個參數組成的維向量,即(總體原點矩估計)(樣本原點矩)(,),由此得到個聯立方程,解之得,稱之為矩法估計量。例1 求總體均值、方差的矩估計解,;,所以,即矩法估

4、計中總體均值的估計量為樣本均值,總體方差估計量為樣本方差。例2 兩點分布,設,求的矩估計。解,所以,(概率(頻率)例3總體,求的矩估計。解,所以,二、極大似然估計極大似然估計以概率最大為依據。如老獵人和新手同時朝一只野兔射擊,野兔被擊中但只中一槍,我們可認為是老獵人打中的。方法 設總體分布已知,為密度函數,則樣本,的概率密度為直觀想法:哪一組參數值使現在的樣本,出現的可能性最大,哪一組參數可能就是真正的參數。樣本落在的鄰域內的概率為,極大似然法就是使樣本落在鄰域內的概率達到最大的參數作為估計量。記(稱為似然函數)定義作為的函數,它在時最大,則稱為的極大似然估計。即當關于可微時,(稱為似然方程組

5、),解之得由于、極值點相同,所以似然方程組可簡化成當X為離散型時,事件“”發生的概率為例4 設總體,求的極大似然估計解,解之得,與矩法估計的結果(例1)相同。例5總體,求的極大似然估計。解無法用微分法求極值。因為,所以,這以矩估計不同例6 設總體X的概率密度為,,為樣本,求參數的矩估計和極大似然估計例7總體,求的極大似然估計。解無法用微分法求極值,必須從極大似然法估計的定義出發,求的最在值,即盡可能小,但,否則,所以,兩種點估計中,矩估計直觀簡單;極大似然估計效果比較好,但要知道總體分布,且計算較復雜。總體為正態分布、泊松分布、二項分布時,總體分布中的未知參數的矩估計和極大似然估計相同。第二節

6、 估計量優良性的標準同一個未知參數可能有若干種不同的估計,需要對參數的估計的優良性進行評價。估計量是隨機變量,不同的觀測結果就會得到不同的參數估計值,因而一個好的估計應在多次重復試驗中體現出其優良性。一、無偏性一個好的估計量其不同的估計值應在未知參數真值的附近,由此引出無偏性標準。定義 設為的一個估計量,若,則稱為的無偏估計量。意義 若多次相互獨立地重復用無偏估計量進行實際估計,所得估計值的算術平均值與的真值基本上相同。在科學技術中,稱為用估計時產生的系統偏差,的實際意義是指估計量沒有系統偏差,只有隨機偏差。例1,可修改為,例2 設總體X服從二點分布,設,為未知參數,,是樣本,證明:是的無偏估

7、計。例3 設總體X服從區間上的均勻分布,其中為未知參數,又,為樣本,證明是的無偏估計。例4設總體X的均值 與方差均為未知參數,為樣本。證明為的無偏估計。為的一個估計量,為的一個實值函數,我們通常用作為的估計,但是的無偏估計,不一定是的無偏估計。例如,樣本標準差不是總體標準差的無偏估計。二、有效性均方誤差:越小越優,即對的偏離程度越小越好。當為的無偏估計時,這時方差越小越優。定義 設、為的兩個無偏估計量,若,則稱比有效的無偏估計量。設為的無偏估計量,如果,都有,則稱為的有效估計量。例5為總體的樣本,比較下列無偏估計量的好壞。(1)、(2)、(3)例6 證明(線性估計量),當時三、一致性一個好的估

8、計量應是無偏的,且是具有較小方差的,同時當樣本容量無限增大時,估計量能在某種意義上無限地接近于未知參數的真值。由此引入一致性(相合性)標準。定義 設為未知參數的估計量,若對任意的,均有,則稱為參數的一致估計量。第三節參數的區間估計一、置信區間引例某批輪胎壽命(公里),從中隨機抽取100只輪胎,其平均壽命為32000公里,求輪胎平均壽命的區間估計。解 點估計(公里),由查正態表得對于有,查表可得 1-正態表,時查例如,取,由解得,又由得,稱為置信水平,稱為的置信區間。定義 總體分布有一個未知參數,由樣本,確定的兩個統計量和,對于給定的,滿足,則稱隨機區間為的置信區間,稱為置信水平(度、系數、概率

9、),稱為顯著水平,分別稱為置信下限、上限。意義 保證參數有的概率落在區間中。通常取、參數的區間估計的原則:在保證有一定的置信度下,盡可能地提高精確度。構造未知參數的置信區間的方法:(1)抽樣得樣本,,構造一個包含的函數,分布已知的,且分布與無關;(2)對給定的置信水平,根據的分布函數,確定使;(3)由解得,即的置信水平為的置信區間。二、均值的置信區間正態總體(),在置信水平下,對總體未知均值的區間估計。(1)總體方差已知時,由引例易知,的置信區間 置信系數越大,越小,越大,區間估計的長度越長,精確度越低;樣本容量越大,區間估計的長度越短,精度越高。(2)總體方差未知時,所以,的置信區間 查表中

10、的及自由度而得。例1設總體X服從正態分布,其中已知,,為樣本,記,,對于給定的值(),若的置信水平為的置信區間的下限為,則該區間的上限為( )(A)(B) (C) (D)例2 某藥品每片中有效成分含量X(單位:)服從正態分布。現從該藥品中任意抽取8片進行檢驗,測得其有效成分含量為分別計算該藥品有效成分含量均值的置信度為及的置信區間。()例3 隨機地從一批釘子中抽取16枚,測得它們的直徑(,)(單位:厘米),并求得其樣本均值,樣本方差,已知,設釘子的直徑分布為正態分布,試求總體均值的置信水平為的置信區間。例4 已知某市新生嬰兒體重X(單位:)服從正態分布。其中未知,試用該市新生嬰兒體重的如下樣本

11、求出該市新生嬰兒平均體重的置信度為的置信區間。()三、方差的置信區間正態總體(),在置信水平下,對總體未知方差的區間估計。,總體方差的置信區間 注意:查分布表中及自由度而得。例5 求例4中總體方差的置信度為的置信區間。例6自動包裝機包裝某食品,每袋凈重。現隨機抽取10袋,測得每袋凈重(克),(,10),計算得,若未知,求的置信度為95%的置信區間,求的置信度為95%的置信區間。(附)四、雙樣本場合,正態總體,、,和獨立,來自總體,,來自總體、在置信水平下,對的區間估計。(1)方差已知時,的置信區間為(2)方差未知時,這是因為、,所以時,即的置信區間為例7 欲比較甲、乙兩種棉花品種的優劣,現假設

12、用它們紡出的棉紗強度分別服從和,試驗者從這兩種棉花中分別抽取,和,,其均值為,求的置信區間()(,的置信區間為)例8 某公司利用兩條生產線生產灌裝礦泉水,現從生產線上隨機抽取樣本,和,,它們是每瓶礦泉水的體積(毫升),其均值為,樣本方差為,假設這兩條生產線灌裝的礦泉水的體積分別服從和,求的置信區間()(,的置信區間為)上述兩例中,的置信區間包括了零,即可能大于,也可能小于,此時認為和并沒有顯著差異。(3)雙樣本場合,正態總體,、,均值未知,和獨立,來自總體,,來自總體、在置信水平下,對的區間估計。因為的置信區間為其中,查分布表中及第一自由度,第二自由度而得。四、非正態總體的區間估計當樣本容量比

13、較大時,總體均值的置信區間仍可用正態總體來討論,這時的置信區間是近似的。設總體均值為,方差為,,為樣本,由于這些樣本是獨立同分布的,由中心極限定理知,對充分大的樣本容量,近似有在置信水平下:(1)總體方差已知時,的置信區間近似為(2)總體方差未知時,用的一個估計,例如來代替,得的置信區間近似為(樣本容量比較大,因而正態分布和分布近似)實踐表明,當時,近似程度是可以接受的。例9 某公司欲估計自己生產的電池壽命,現從其產品中隨機抽取50只電池做試驗,得(單位:100小時),求該公司生產的電池平均壽命的置信系數為的置信區間。(,)五、二項分布和泊松分布的參數的區間估計(),由中心極限定理知,對充分大的樣本容量,近似有,()這樣得出的置信區間有未知參數,實際應用中,可以用代替,即因而在置信水平下,的置信區間近似為例10 商品檢驗部門隨機抽查了某公司生產的產品100件,發現其中合格產品84件,試求該產品合格率的置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論