




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
總體參數的區間估計
與假設檢驗第十三講大綱參數的區間估計含義基本步驟總體均值、方差和比例的區間估計參數假設檢驗的基本概念基本思想p值否定域與接受域區間估計問題的提出例:已知來自正態總體的樣本均值,如果我們進行大量的重復抽樣,那么95%的
Xbar會落在一個什么樣的關于
的對稱區間中?根據,得到
r=normsinv(0.975)*
=1.96
當m已知時我們可以得到上式的含義:一次抽樣后,我們得到一個來自正態總體的樣本均值,它有95%的可能性落在區間(m-r,m+r)中但是m是未知的,如何根據
求m的區間?求m的區間當
已知,m未知時,把m作為未知數求解,得到上式的含義:區間
有95%的概率包含真實的參數m
每次抽樣會有一個,從而區間會隨樣本的不同而變化,成為隨機區間注意:
m不是隨機變量總體均值的置信區間如果區間滿足則稱之為總體均值m置信度為95%的置信區間我們有95%的把握保證該區間包含真實的m反復抽取容量為n的樣本,都可得一個置信區間,但每個置信區間不一定包含未知參數的真值,而包含真值的區間占95%注意:不能說,m有95%的可能性落在區間
內,因為m不是隨機變量置信區間的一般定義如果
,則稱為總體參數q的置信區間,其中,1-
a為置信度或置信水平,a為顯著水平置信區間的理解要點根據一組樣本觀測值作出估計,給出估計值的范圍用概率術語(置信度或置信水平)說明估計值與未知總體參數的接近程度區間估計的基本步驟區間估計就是求解置信區間確定待估參數和置信水平;確定估計量,并找出估計量的抽樣分布;利用抽樣分布給出置信區間重點是確定估計量,它含有待估參數,不含其它未知參數,它的分布已知,
且分布不依賴于待估參數關鍵是確定2已知時,總體均值的區間估計適用情形:來自正態總體的抽樣,且方差已知
大樣本情形,總體方差已知都有樣本均值服從正態分布將該分布轉化為標準正態分布,即推導置信區間半徑r對于1-
a的置信區間,有90%置信度的區間半徑為95%置信度的區間半徑為99%置信度的區間半徑為a越小,r越大要求的置信度越高,區間半徑越大Excel中的Confidence函數運用Excel中的Confidence函數,直接求置信區間的半徑rr又稱之為極限誤差
Confidence(a,standard_dev,size)a為顯著水平Standard_dev:總體標準差(如果已知);或樣本標準差(如果總體標準差未知,又是大樣本情形)Size:樣本容量
對置信區間的模擬與觀察用Excel進行置信區間的計算從一個均值為5,標準差為3的正態總體進行1000次重復抽樣,每個樣本包含10個樣本點。現在每個樣本的均值已知總體均值未知,但總體方差已知觀察在不同的置信度下,1000個置信區間包含真實總體均值的比例例假設樣本取自50名乘車上班的員工,他們花在路上的平均時間為30分鐘,總體標準差為2.5分鐘。則總體均值落入下列區域內的置信度為95%:即:Confidence(0.05,2.5,50)=0.692951花在上班路上的平均時間為30±0.692951分鐘,或29.3到30.7分鐘說明在前面的估計中,我們都假定樣本為簡單隨機樣本,即為放回隨機抽樣得到的在不放回抽樣的時候,我們需要引入一個有限總體修正系數
,其中N為總體單位數,n為樣本容量。這時有限總體修正系數主要適用于當n占N比例很大時的不放回抽樣例一個擁有50位員工的公司想了解員工每天上網的時間,抽樣記錄了10位員工,結果平均數為60分鐘。已知該公司員工上網的時間為正態分布,標準差為20分鐘,求總體均值90%的置信區間
=Confidence(a,standard_dev,size)*=Confidence(0.1,20,10)*(40/49)^0.5=9.4所以總體均值90%的置信區間為(50.6,69.4)如果不考慮有限總體修正系數,得到的置信區間為(49.6,70.4),區間變大根據誤差,求樣本容量接上題,如果希望誤差不超過5分鐘,應該選取多少人?根據
可知:2未知時,總體均值的區間估計當總體方差未知,又是正態總體時,有統計量當n很大時,近似服從標準正態分布置信區間半徑
ta=tinv(a,df)有限總體修正系數例張先生是臺灣某集團的企劃部經理,在今年的規劃中,集團準備在某地新建一家新的零售商店,設立商店要求行人數最低為520。張先生目前正在做這方面的準備工作。其中經過該地行人數量是他要考慮的一個很重要的方面。張先生委托他人進行了兩個星期的觀察,得到每天經過該地人數如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178根據以上數據,張先生應該作出怎樣的判斷?張先生決策的依據就是經過此地的行人數是否平均每天達到520人需要計算總體均值的置信區間,取a=5%問題性質:小樣本,總體方差未知,正態總體,n占N比例很小=tinv(0.05,13)*得到的置信區間為(306,500)含義:有95%的把握可以認為每天的平均行人數在(306,500)之間,沒有達到520,不建議設店正態總體方差的區間估計當m已知時,,從而得到得2
置信度為1-
a的置信區間為
正態總體方差的區間估計當m未知時,有統計量置信區間為這種情形是最常見和常用的=Chiinv(a/2,n-1)某工廠生產一批滾珠,其直徑X服從正態分布N(
2),現從某天的產品中隨機抽取
6
件,測得直徑為
15.1,
14.8,
15.2,
14.9,
14.6,
15.1
(1)若
2=0.06,求
的置信區間
(2)若
2未知,求
的置信區間
(3)求方差
2的置信區間練習總體比例的區間估計已知如果樣本容量n足夠大(np和n(1-p)都大于5),或者即使n不大,只要p接近0.5,樣本比例的樣本分布為:
標準化的結果為:
同理可以得出對總體比例p的區間估計半徑總體參數的假設檢驗什么是假設檢驗利用樣本所提供的信息判斷各種說法的真偽,對總體參數進行一種推斷基本思想:概率性質的反證法小概率事件在一次試驗中幾乎不可能發生,p≤0.05先假設某種說法成立,導出了不合理的現象,說明原假設不正確;沒有導出不合理現象,不能拒絕原假設概率性質的反證法與反證法兩者是有區別的反證法不合理是邏輯中的絕對矛盾概率性質的反證法基于小概率事件在一次觀察中被認為基本不會發生不存在邏輯中的絕對矛盾如果原假設真的成立,而得到樣本觀測結果的概率很小,一個小概率的事件在一次實驗中居然發生了,這是我們不能夠接受的,在這種情況下我們只能拒絕原假設例子討論一家速遞公司聲稱該公司市內門到門的速遞時間平均只有28分鐘,為了證實該廣告是否可靠,我們隨機跟蹤了100件業務,結果發現其平均投遞時間為31.5分鐘,標準差為5分鐘。請問它的廣告可信嗎?假設廣告可信,看看會不會產生不合理的現象令H0代表所提出的假設,H0:m=28;令H1代表與此對立的假設,H1:m≠28;先看一下置信區間因為n=100,為大樣本情形,可以認為近似有當n=100,Xbar=31.5,a=5%時,m的置信區間為[30.5,32.5]因為28<30.5,因此原假設所聲稱的m=28不在95%的置信區間內我們有95%的把握可以拒絕H0,做出這樣的結論并不是百分之百正確,但我們犯錯誤的可能性為a=5%再看一下概率如果H0:m=28真的成立的話,那么我們隨機調查的結果為
的可能性為多少?=1-normdist(31.5,28,5/100^0.5,1)=0如果原假設真的成立,那么出現我們上述隨機調查結果的概率幾乎為零一個零概率的事件在一次實驗中居然發生了,這是我們不能接受的,所以我們只能拒絕原假設假設檢驗中的兩類錯誤零假設:又稱原假設、基本假設,陳述的是需要檢驗的假設,用H0表示備擇假設:又稱被選假設、對立假設,陳述的是與零假設的對立情況,用H1表示第一類錯誤:以真為假,把正確的假設當作錯誤予以否定后果往往嚴重,出現第一類錯誤的概率記為a第二類錯誤:以假為真,把錯誤的假設認為正確予以接受,出現概率記作b
通常不易計算兩類錯誤與司法審判裁決
實際情況裁決實際情況有罪無罪有罪無罪有罪正確第II類錯誤冤枉好人有罪正確第I類錯誤冤枉好人無罪第I類錯誤放走壞人正確無罪第II類錯誤放走壞人正確法院裁決H0
:有罪法院裁決H0
:無罪判斷實際情況H0為真H0為假接受H01-a第二類錯誤(b),取偽拒絕H0第一類錯誤(a),棄真檢驗力(1-b)統計檢驗過程:H0
檢驗不能同時降低兩類錯誤在一定的樣本容量下,減小第一類錯誤發生的概率,必然增大第二類錯誤發生的概率在假設檢驗中,我們通常只關注第一類錯誤的發生,只對a的大小予以限制這是因為第一類錯誤發生的概率易于計算檢驗力(power):1-b減小第二類錯誤發生的概率,意味著提高檢驗力提高檢驗力的途徑:增加樣本容量,加大零假設與備擇假設間的差異性,減少調查誤差圖示:
a
與b
的說明H0:m=m0;H1:m=m1當樣本均值落在紅線左邊的陰影的區域內時,我們拒絕H0,此時我們犯錯誤的概率為a
當樣本均值落在紅線右邊的陰影區域內時,其概率為b,我們不能拒絕H0,此時我們犯錯誤的概率為bp值p值是一個概率值;它是原假設為真時,樣本統計量不同于(大于或小于,依情況而定)實測值的概率p值還被稱為觀察到的(或實測的)樣本值的顯著性水平,是H0能被拒絕的最小值
p值越小,表明原假設越有可能為假當p值大于顯著水平時,拒絕原假設當p值小于顯著水平時,不能拒絕原假設否定域與接受域給定統計量或p值的臨界值,當統計量或p值超過臨界值時,我們會拒絕原假設由統計量或p值臨界值所確定的拒絕原假設的區域稱為拒絕域,反之為接受域假設檢驗中通常選擇顯著水平a作為p值的臨界值拒絕域的大小與顯著水平a的大小有關同一組樣本值,在不同的顯著水平下,可能得出截然相反的結論否定域的分布通常而言,否定域位于統計量分布曲線的尾部,具體的方向取決于備擇假設的具體內容對于H1:m≠m0,拒絕域在分布曲線的兩側,稱為雙尾或雙側檢驗對于H1:m>m0,拒絕域在分布曲線的右側對于H1:m<m0,拒絕域在分布曲線的左側建立檢驗假設的原則將樣本觀測值所支持的結論作為備擇假設H1這是因為當我們拒絕零假設時,我們所犯的錯誤概率是可以控制的,所以應當把期望拒絕的結論作為零假設,期望保護的結論作為備擇假設同時,根據概率意義下的反證法,拒絕原假設是有說服力的,而接受原假設是沒有說服力的。因此應把希望否定的假設作為原假設例觀察到樣本均值
,可以建立的假設檢驗有:H0:m=
103;H1:m≠103
或H0:m≥
103;H1:m<103如果反過來會怎樣?H0:m≤
103;H1:m>103拒絕域在右側,由于樣本均值≤103,這樣我們永遠沒有機會拒絕原假設!雙尾檢驗適用于檢驗無方向性的研究假設,這種假設表明的是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢代婚禮活動策劃方案
- 沙龍造型活動方案
- 民間廣場舞活動方案
- 棋牌活動中秋節活動方案
- 梧林古村落元旦活動方案
- 每天計算活動方案
- 正月藥店活動方案
- 森馬店年后活動方案
- 水果試吃群活動方案
- 榆次漢堡店活動方案
- 2025年有限空間作業安全知識測試試卷
- 工地施工特種設備管理制度
- 2025年數字內容創作師資格考試試卷及答案
- 胖東來投訴管理制度
- 2024-2025新入職員工安全培訓考試試題及完整答案【一套】
- 2025年內蒙古鄂爾多斯機場管理集團鄂爾多斯市空港實業有限公司招聘筆試參考題庫含答案解析
- 2025年鄭州市公安機關招聘警務輔助人員題庫帶答案分析
- CJ/T 340-2016綠化種植土壤
- 廬山市國有投資控股集團有限公司招聘筆試題庫2025
- 2025年貴州省公務員錄用考試《行測》真題及答案解析
- 第一單元:三視圖的判斷、確認與繪制專項練習-2023-2024學年五年級數學下冊典型例題系列(原卷版)人教版
評論
0/150
提交評論