




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第 6章 假設檢驗1 假設檢驗的基本問題 2 一個正態總體參數的檢驗3 兩個正態總體參數的檢驗4 假設檢驗中的其他問題假設檢驗在統計方法中的地位統計方法描述統計推斷統計參數估計假設檢驗學習目標了解假設檢驗的基本思想 掌握假設檢驗的步驟對實際問題作假設檢驗利用置信區間進行假設檢驗利用P - 值進行假設檢驗6.1 假設檢驗的基本問題假設問題的提出假設的表達式兩類錯誤假設檢驗中的值假設檢驗的另一種方法單側檢驗讓我們先看一個例子.基本概念 生產流水線上罐裝可樂不斷地封裝,然后裝箱外運. 怎么知道這批罐裝可樂的容量是否合格呢?罐裝可樂的容量按標準應為355毫升.基本概念 每隔一定時間,抽查若干罐 . 如
2、每隔1小時,抽查5罐,得5個容量的值X1,X5,根據這些值來判斷生產是否正常.通常的辦法是進行抽樣檢查.基本概念根據樣本的信息檢驗關于總體的某個命題是否正確.這類問題稱作假設檢驗問題 .基本概念什么是假設?(hypothesis) 對總體參數的的數值所作的一種陳述總體參數包括總體均值、比例、方差等分析之前必需陳述我認為該地區新生嬰兒的平均體重為3190克!什么是假設檢驗? (hypothesis testing)事先對總體參數或分布形式作出某種假設,然后利用樣本信息來判斷原假設是否成立有參數假設檢驗和非參數假設檢驗采用邏輯上的反證法,依據統計上的小概率原理假設檢驗的基本思想. 因此我們拒絕假設
3、 = 50. 如果這是總體的真實均值樣本均值m = 50抽樣分布H0這個值不像我們應該得到的樣本均值 .20總體假設檢驗的過程抽取隨機樣本均值 X = 20我認為人口的平均年齡是50歲 提出假設 拒絕假設! 別無選擇.作出決策假設檢驗的步驟提出假設確定適當的檢驗統計量規定顯著性水平計算檢驗統計量的值作出統計決策提出原假設和備擇假設 什么是原假設?(null hypothesis)待檢驗的假設,又稱“0假設”研究者想收集證據予以反對的假設3.總是有等號 , 或4.表示為 H0H0: 某一數值 指定為 = 號,即 或 例如, H0: 3190(克)為什么叫0假設?為什么叫 0 假設?之所以用零來修
4、飾原假設,其原因是原假設的內容總是沒有差異或沒有改變,或變量間沒有關系等等零假設總是一個與總體參數有關的問題,所以總是用希臘字母表示。關于樣本統計量如樣本均值或樣本均值之差的零假設是沒有意義的,因為樣本統計量是已知的,當然能說出它們等于幾或是否相等 什么是備擇假設?(alternative hypothesis)與原假設對立的假設,也稱“研究假設”研究者想收集證據予以支持的假設總是有不等號: , 或 表示為 H1H1: 某一數值,或 某一數值例如, H1: ,不拒絕 H0若p-值 /2, 不拒絕 H0若p-值 /2, 拒絕 H0雙側檢驗與單側檢驗 (假設的形式)假設研究的問題雙側檢驗左側檢驗右
5、側檢驗H0m = m0m m0m m0H1m m0m m0雙側檢驗(原假設與備擇假設的確定)屬于決策中的假設檢驗不論是拒絕H0還是不拒絕H0,都必需采取相應的行動措施例如,某種零件的尺寸,要求其平均長度為10cm,大于或小于10cm均屬于不合格我們想要證明(檢驗)大于或小于這兩種可能性中的任何一種是否成立建立的原假設與備擇假設應為 H0: = 10 H1: 10雙側檢驗(顯著性水平與拒絕域 )抽樣分布H0值臨界值臨界值a/2 a/2 樣本統計量拒絕域拒絕域1 - 置信水平雙側檢驗(顯著性水平與拒絕域)H0值臨界值臨界值a/2 a/2 樣本統計量拒絕域拒絕域抽樣分布1 - 置信水平雙側檢驗 (顯
6、著性水平與拒絕域)H0值臨界值臨界值 a/2 a/2 樣本統計量拒絕域拒絕域抽樣分布1 - 置信水平雙側檢驗 (顯著性水平與拒絕域)H0值臨界值臨界值a/2 a/2 樣本統計量拒絕域拒絕域抽樣分布1 - 置信水平單側檢驗(原假設與備擇假設的確定)將研究者想收集證據予以支持的假設作為備擇假設H1例如,一個研究者總是想證明自己的研究結論是正確的一個銷售商總是想正確供貨商的說法是不正確的備擇假設的方向與想要證明其正確性的方向一致將研究者想收集證據證明其不正確的假設作為原假設H0先確立備擇假設H1單側檢驗 (原假設與備擇假設的確定)一項研究表明,采用新技術生產后,將會使產品的使用壽命明顯延長到1500
7、小時以上。檢驗這一結論是否成立研究者總是想證明自己的研究結論(壽命延長)是正確的備擇假設的方向為“”(壽命延長)建立的原假設與備擇假設應為 H0: 1500 H1: 1500單側檢驗 (原假設與備擇假設的確定)一項研究表明,改進生產工藝后,會使產品的廢品率降低到2%以下。檢驗這一結論是否成立研究者總是想證明自己的研究結論(廢品率降低)是正確的備擇假設的方向為“”(廢品率降低)建立的原假設與備擇假設應為 H0: 2% H1: 2%單側檢驗 (原假設與備擇假設的確定)某燈泡制造商聲稱,該企業所生產的燈泡的平均使用壽命在1000小時以上。如果你準備進一批貨,怎樣進行檢驗檢驗權在銷售商一方作為銷售商,
8、你總是想收集證據證明生產商的說法(壽命在1000小時以上)是不是正確的備擇假設的方向為“”(壽命不足1000小時)建立的原假設與備擇假設應為 H0: 1000 H1: 1020n = 16臨界值(s):檢驗統計量: 在 的水平上拒絕H0有證據表明這批燈泡的使用壽命有顯著提高決策:結論:Z0拒絕域0.051.6452 未知大樣本均值的檢驗 (例題分析)【例】某電子元件批量生產的質量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產的元件質量大大超過規定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產的電子元件質量顯著地高于
9、規定標準? (0.05)單側檢驗2 未知大樣本均值的檢驗 (例題分析)H0: 1200H1: 1200 = n = 100臨界值(s):檢驗統計量: 在 的水平上不拒絕H0不能認為該廠生產的元件壽命顯著地高于1200小時決策:結論:Z0拒絕域0.051.645總體均值的檢驗 (2未知小樣本)1.假定條件總體為正態分布2未知,且小樣本2.使用t 統計量2 未知小樣本均值的檢驗 (例題分析)【例】某機器制造出的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為,標準差為,試以的顯著性水平檢驗機器性能良好的假設。 雙側檢驗2 未知小樣本均值的檢驗 (例題分析)H0:
10、 = 5H1: 5df = 10 - 1 = 9臨界值(s):檢驗統計量: 在 的水平上拒絕H0說明該機器的性能不好 決策:結論:t02.262-2.262.025拒絕 H0拒絕 H0.0252 未知小樣本均值的檢驗 (P 值的計算與應用)第1步:進入Excel表格界面,選擇“插入”下拉菜單第2步:選擇“函數”點擊,并在函數分類中點擊“統 計” ,然后,在函數名的菜單中選擇字符 “TDIST”,確定第3步:在彈出的X欄中錄入計算出的t值3.16 在自由度(Deg-freedom)欄中錄入9 在Tails欄中錄入2,表明是雙側檢驗(單測 檢驗則在該欄內錄入1) P值的結果為,拒絕H02 未知小樣
11、本均值的檢驗 (例題分析)【例】一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,測得平均值為41000公里,標準差為5000公里。已知輪胎壽命的公里數服從正態分布,我們能否根據這些數據作出結論,該制造商的產品同他所說的標準相符?( = 0.05)單側檢驗!均值的單尾 t 檢驗 (計算結果) H0: 40000H1: 40000df = 20 - 1 = 19臨界值(s):檢驗統計量: 在 的水平上不拒絕H0不能認為制造商的產品同他所說的標準不相符決策: 結論: -1.7291t0拒絕域.05總體比例的
12、檢驗(Z 檢驗)適用的數據類型離散數據 連續數據數值型數據數 據品質數據一個總體比例檢驗假定條件有兩類結果總體服從二項分布可用正態分布來近似比例檢驗的 Z 統計量0為假設的總體比例一個總體比例的檢驗 (例題分析)【例】一項統計結果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統計是否可靠,隨機抽選了400名居民,發現其中有57人年齡在65歲以上。調查結果是否支持該市老年人口比重為14.7%的看法?(= )雙側檢驗一個總體比例的檢驗 (例題分析)H0: = 14.7%H1: 14.7%n = 400臨界值(s):檢驗統計量:在 的水平上不拒絕H0該市老年
13、人口比重為14.7%決策:結論:Z01.96-1.96.025拒絕 H0拒絕 H0.025方差的卡方 (2) 檢驗檢驗一個總體的方差或標準差假設總體近似服從正態分布檢驗統計量樣本方差假設的總體方差方差的卡方 (2) 檢驗(例題分析)【例】某廠商生產出一種新型的飲料裝瓶機器,按設計要求,該機器裝一瓶一升(1000cm3)的飲料誤差上下不超過1cm3。如果達到設計要求,表明機器的穩定性非常好。現從該機器裝完的產品中隨機抽取25瓶,分別進行測定(用樣本減1000cm3),得到如下結果。檢驗該機器的性能是否達到設計要求 ()0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.
14、30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1雙側檢驗方差的卡方 (2) 檢驗(例題分析)H0: 2 = 1H1: 2 1df = 25 - 1 = 24臨界值(s):統計量: 在 的水平上不拒絕H0不能認為該機器的性能未達到設計要求 2039.3612.40 /2 =.05決策:結論:6.3 兩個正態總體參數的檢驗檢驗統計量的確定兩個總體均值之差的檢驗兩個總體比例之差的檢驗兩個總體方差比的檢驗檢驗中的匹配樣本兩個正態總體參數的檢驗兩個總體的檢驗Z 檢驗(大樣本)t 檢驗(小樣本)t 檢驗(小樣本)Z 檢驗F 檢驗獨立樣本配對樣本均值比例方差獨立樣本
15、總體均值之差的檢驗兩個獨立樣本之差的抽樣分布 m1s1總體1s2 m2總體2抽取簡單隨機樣樣本容量 n1計算X1抽取簡單隨機樣樣本容量 n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1- m2抽樣分布兩個總體均值之差的檢驗 (12、 22 已知)1.假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布若不是正態分布, 可以用正態分布來近似(n130和 n230)檢驗統計量為兩個總體均值之差的檢驗 (假設的形式)假設研究的問題沒有差異有差異均值1 均值2均值1 均值2H0 1 2 = 0 1 2 0 1 2 0H1 1 20 1 2 0兩個總體均值之差的檢驗 (例題分析) 雙側
16、檢驗!【例】有兩種方法可用于制造某種以抗拉強度為重要特征的產品。根據以往的資料得知,第一種方法生產出的產品其抗拉強度的標準差為8公斤,第二種方法的標準差為10公斤。從兩種方法生產的產品中各抽取一個隨機樣本,樣本容量分別為n1=32,n2=40,測得x2= 50公斤,x1= 44公斤。問這兩種方法生產的產品平均抗拉強度是否有顯著差別? ( = 0.05)兩個總體均值之差的檢驗 (例題分析)H0: 1- 2 = 0H1: 1- 2 0n1 = 32,n2 = 40臨界值(s):檢驗統計量:決策:結論: 在 的水平上拒絕H0有證據表明兩種方法生產的產品其抗拉強度有顯著差異Z01.96-1.96.02
17、5拒絕 H0拒絕 H0.025兩個總體均值之差的檢驗 (12、 22 未知且不相等,小樣本)檢驗具有不等方差的兩個總體的均值假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布兩個總體方差未知且不相等12 22檢驗統計量其中:兩個總體均值之差的檢驗 (12、 22 未知但相等,小樣本)檢驗具有等方差的兩個總體的均值假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布兩個總體方差未知但相等12 = 22檢驗統計量兩個總體均值之差的檢驗 (例題分析)單側檢驗【例】 “多吃谷物,將有助于減肥。”為了驗證這個假設,隨機抽取了35人,詢問他們早餐和午餐的通常食譜,根據他們的食譜,將其分為二類,一類為經常
18、的谷類食用者(總體1),一類為非經常谷類食用者(總體2)。然后測度每人午餐的大卡攝取量。經過一段時間的實驗,得到如下結果:檢驗該假設 ( = 0.05)兩個總體均值之差的檢驗 (例題分析用統計量進行檢驗)H0: 1- 2 0H1: 1- 2 0 = n1 = 15,n2 = 20臨界值(s):檢驗統計量:決策:結論: 在 的水平上拒絕H0沒有證據表明多吃谷物將有助于減肥-1.694t0拒絕域.05兩個總體均值之差的檢驗 (例題分析用R進行檢驗)第1步:選擇“工具”下拉菜單,并選擇“數據分析”選項第2步:選擇“t檢驗,雙樣本異方差假設”第3步:當出現對話框后 在“變量1的區域”方框內鍵入數據區域
19、 在“變量2的區域”方框內鍵入數據區域 在“假設平均差”的方框內鍵入0 在“”框內鍵入 在“輸出選項”中選擇輸出區域 選擇確定 用R進行檢驗兩個總體均值之差的檢驗(匹配樣本的 t 檢驗)1.檢驗兩個總體的均值配對或匹配重復測量 (前/后)2.假定條件兩個總體都服從正態分布如果不服從正態分布,可用正態分布來近似 (n1 30 , n2 30 )匹配樣本的 t 檢驗 (假設的形式)假設研究的問題沒有差異有差異總體1 總體2總體1 總體2H0mD = 0mD 0mD 0H1mD 0mD 0注:Di = X1i - X2i ,對第 i 對觀察值匹配樣本的 t 檢驗 (數據形式) 觀察序號樣本1樣本2差
20、值1x 11x 21D1 = x 11 - x 212x 12x 22D1 = x 12 - x 22MMMMix 1ix 2iD1 = x 1i - x 2iMMMMnx 1nx 2nD1 = x 1n- x 2n匹配樣本的 t 檢驗(檢驗統計量)樣本差值均值樣本差值標準差自由度df nD - 1統計量D0:假設的差值【例】一個以減肥為主要目標的健美俱樂部聲稱,參加其訓練班至少可以使減肥者平均體重減重kg以上。為了驗證該宣稱是否可信,調查人員隨機抽取了10名參加者,得到他們的體重記錄如下表:匹配樣本的 t 檢驗 (例題分析)在 的顯著性水平下,調查結果是否支持該俱樂部的聲稱?訓練前94.51
21、01110103.59788.596.5101104116.5訓練后8589.5101.5968680.58793.593102單側檢驗樣本差值計算表訓練前訓練后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合計98.5配對樣本的 t 檢驗(例題分析)配對樣本的 t 檢驗 (例題分析)差值均值差值標準差H0: m1 m2 H1: m1 m2 adf = 10 - 1 = 9臨界值(s):檢驗統計量:決策:結論: 在 的水平上不拒絕H0不能認為該俱
22、樂部的宣稱不可信配對樣本的 t 檢驗 (例題分析)-1.833t0拒絕域.05配對樣本的 t 檢驗 (例題分析用R進行檢驗)第1步:選擇“工具” 第2步:選擇“數據分析”選項第3步:在分析工具中選擇“t檢驗:平均值的成對二樣本分析”第4步:當出現對話框后 在“變量1的區域”方框內鍵入數據區域 在“變量2的區域”方框內鍵入數據區域 在“假設平均差”方框內鍵入 顯著性水平保持默認值 用R進行檢驗兩個總體比例之差的檢驗1.假定條件兩個總體是獨立的兩個總體都服從二項分布可以用正態分布來近似檢驗統計量兩個總體比例之差的Z檢驗兩個總體比例之差的檢驗(假設的形式)假設研究的問題沒有差異有差異比例1 比例2比
23、例1 比例2H0P1P2 = 0P1P20P1P20H1P1P20P1P20兩個總體比例之差的Z檢驗 (例題分析)單側檢驗 【例】對兩個大型企業青年工人參加技術培訓的情況進行調查,調查結果如下:甲廠:調查60人,18人參加技術培訓。乙廠調查40人,14人參加技術培訓。能否根據以上調查結果認為乙廠工人參加技術培訓的人數比例高于甲廠?()兩個總體比例之差的Z檢驗 (例題分析)H0: 1- 2 0H1: 1- 2 0 = n1 = 60,n2 = 40臨界值(s):檢驗統計量:決策:結論: 在 的水平上不拒絕H0沒有證據表明乙廠工人參加技術培訓的人數比例高于甲廠-1.645Z0拒絕域兩個總體方差比的檢驗(F 檢驗)假定條件兩個總體都服從正態分布,且方差相等兩個獨立的隨機樣本假定形式H0:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業設計與制造工藝的融合實踐
- 工業遺產旅游的開發與保護策略
- 工業設計原理與創意實踐
- 工作壓力下的心理調適與應對策略
- 工作中的創造力提升策略研究
- 工業領域機房的綠色節能技術應用
- 工程學中的計算方法研究
- 工作流程優化提高工作效率的方法與技巧
- 工廠安全生產與事故預防培訓
- 工程質量管理中的風險評估方法
- 村衛生室工作分工協議書范文
- 人工智能算法與實踐-第16章 LSTM神經網絡
- 研學旅行市場營銷智慧樹知到答案2024年青島酒店管理職業技術學院
- 抖音直播帶貨合作協議書范本
- GB 44246-2024家用和類似用途電器、體育用品的電氣部分及電玩具安全技術規范
- 教育咨詢員合同范本樣本
- DL∕T 1474-2021 交、直流系統用高壓聚合物絕緣子憎水性測量及評估方法
- 勞動合同中止執行協議
- 2024年四川省樂山市中考地理試卷(含答案)
- 貨運車輛駕駛員安全教育培訓(3篇模板)
- 基于排隊網絡理論的集裝箱碼頭設備配置優化研究
評論
0/150
提交評論