




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第3部分:,單樣本 置信區間和 假設檢驗,第3部分:單樣本置信區間和假設檢驗,目的: 這一部分的目的是介紹連續數據的置信區間和假設檢驗。 目標: 了解假設檢驗和置信區間的基本原理- 確定所觀測的差異是真實的,還是偶然因素引起的。 計算樣本平均值的置信區間,并將這一平均值與期望(或目標)平均值相比較。 使用單樣本置信區間和假設檢驗,將平均值與目標值相比較。,舉例 洗衣機傳動裝置的總高度將影響制動性能。項目Y是總高度,目標值=5.394,加工這種部件時所使用的固定架共有8個。 您想了解什么?,使用第三個固定架生產出的部件的平均高度與目標值是否一致?,分析步驟: 1. 將數據繪制成圖 2. 使用假設
2、檢驗和置信區間來確定所觀測到的差異是否真實。 3. 得出結論。,設備3 的10 個部件的高度,用圖形來表示數據,設備3中10個部件的高度 5.394 5.394 5.393 5.394 5.394 5.395 5.396 5.397 5.395 5.395,總體平均值的最可能的范圍是多少?x(5.3947)與目標值(5.394)之間的差異是由于偶然因素造成的嗎?,置信區間,設備3所制造的所有部件的平均值最可能的取值范圍是什么? 讓我們來計算一下置信區間,以便找出該值! 單個平均值的置信區間,(1-)100%置信度,真正的總體均值 包含在置信區間內。,什么是t分布? 類似于正態分布(z),正態分
3、布(z):已知總體標準差,,t分布(t):估計的標準差, s,用于提供有關平均值的結論(置信區間和假設檢驗),我們將需要使用t分布,t = (x - )/(s / n),-,置信區間,其中: x = 樣本平均值 t = t表格中的t統計結果 a = a風險 df = 自由度 = n -1 s = 樣本標準差 n = 樣本中的數據點數量,置信區間上限值 = x + t(a/2, df),置信區間下限值 = x - t(a/2, df),用所給出的有關部件的數據代入以上公式,置信區間,計算利用設備3所生產的傳輸設備平均高度的置信區間 使用=0.05(95%的置信區間) x = 5.3947 s =
4、 0.00116 n = 10 df = n - 1 = 9 t(a/2,df)取自t表格。 t (0.025,9) = 2.262,區間上限 = x + t (a/2, df),t表格,自由度為9, = .05 /2 = .025,范例-續 設備3所制造部件的平均值是否在目標范圍之內?,設備3生產出的部件總體的平均值最有可能是5.3947,但實際值可能比該值大一點或小一點。,5.393,5.394,5.395,5.396,5.397,設備3,高度 (英寸),目標值 = 5.394英寸,平均值的95%置信區間,置信區間上限值 = 5.3955英寸,置信區間下限值 = 5.3939 英寸,設備3
5、所生產的部件的總體平均值最可能的取值范圍為5.3939到5.3955。,舉例-續,置信區間說明 以這種方式構成的區間的95%是正確的(包含真正的總體平均值),以此構成的區間的5%是不正確的。 目標值5.394包含在此區間內。 統計評價:沒有證據證明設備3所制造部件的平均高度不在目標范圍之內。 實際評價:目標值剛好在置信區間內。計算時只用到10 個數據點,并且=0.05。 您可以使用置信區間來進一步調查設備3 獲得更多樣本(如果是實際的)并計算置信區間 使用不同的值來計算置信區間,置信區間量化了數據的不定性。,樣本大小對置信區間的影響,讓我們取20個以上的樣本(總數 n = 30),看一看對95
6、%的置信區間有何影響。 假設平均值和標準差保持不變:x = 5.3947 和 s = 0.00116 。,置信區間上限值 = x + t (a/2, df),置信區間下限值 = x - t (a/2, df),樣本大小對置信區間的影響-續,通過增加樣本,可以證明設備3所制造部件的平均高度不在目標范圍內。,目標值 = 5.394英寸,n = 10 的95%置信區間為5.3939 - 5.3955. n = 30的95%置信區間為 5.3943 - 5.3951. 唯一改變的是 n。,置信區間隨樣本容量的增加而減小。,對置信區間的影響,計算設備3所制造傳送裝置的平均高度的90%置信區間。取 n =
7、 10 ( x = 5.3947,s = 0.00116),計算設備3所制造傳送裝置的平均高度的99%置信區間。取 n = 10 ( x = 5.3947,s = 0.00116),對置信區間有何影響?,對置信區間的影響,唯一改變的是 a。 我們能夠以90% 置信度來說明設備3所制造的部件不在 目標范圍內 我們不能以99%的置信度說來說明設備3所制造的部件不在 目標范圍內。,置信區間隨著值的增大而增大。,另一種確定是否存在差異的方法: 假設檢驗,置信區間給出了總體值(參數)的最可能的取值范圍。 假設檢驗用于確定所觀測的差異是確實存在,還是偶然產生的。我們可以量化確實存在差異的置信程度。,所有
8、潛在 “ X”,關鍵少數“ X”,定義假設:Ho 和 Ha,Ho 假設檢驗的起點是零假設- H0。H0是相同或沒有差異假設。 舉例:總體均值等于檢驗均值。 Ha 第二條假設是Ha- 備擇假設,即差異假設。 舉例:總體均值不等于檢驗均值。,您通常想表明差異是確實存在的(Ha)。 通過假定相等 (Ho)開始。 如果數據表明它們不相等,則它們一定存在差異(Ha)。,和風險,風險:當H0為真時,拒絕Ho-有時稱為廠商風險 風險:當H0為假時,接受Ho-有時稱為消費者風險,t 檢驗,t檢驗可用來檢驗: 目標值(或檢驗均值)與計算的樣本均值的對比 - 單樣本t檢驗,或者 兩個計算的樣本均值之間的對比 -
9、雙樣本t檢驗(將在第4部分進行討論) 讓我們使用Minitab來執行單樣本t檢驗。 將設備3的平均值與目標值5.394進行比較。 假設檢驗 Ho: = 5.394 Ha: 不等于5.394 在Minitab中打開文件“ lth” L:6sigmaMinitabTrainingMinitabSession 2lth.mtw,點擊“圖形”,雙擊“確定”按鈕運行,單樣本檢驗 t-檢驗-利用Minitab,選擇: Stat Basic Statistics 1-Sample t,點擊兩次“ OK”,運行,鍵入目標平均值,選擇 Ha,單擊 “ Graphs”,單擊 “ Boxplot of data”,
10、置信區間指出了總體平均值的近似值范圍。,Hmmmm 5.394剛好在置信區間內。我們可能會進 一步調查。,按目標均值進行設備3的單樣本t檢驗,Ho 和 Ha的假設,置信區間指出總體均值的最可能的取值范圍。,P值 0.05; 不能拒絕 Ho,5.394剛剛落在置信區間內。也許我們需要進一步調查。,請注意 不得將假設檢驗用作“行/不行”檢驗。 所存在的差異是否真的很重要?,平均值的T-檢驗 Test of mu = 5.39400 vs mu not = 5.39400 Variable N Mean StDev SE Mean T P fix 3 10 5.39470 0.00116 0.000
11、37 1.91 0.089,有關差異的統計決策的三種方法,方法1 如果計算值大于()表格(關鍵)值,則拒絕Ho,接受存在差異。 方法2 如果計算的p值小于(),則拒絕Ho,接受存在差異。 方法3 如果檢驗值(目標值)不在置信區間內,則拒絕Ho,接受存在差異。,這3種方法將得出相同的結論。,何謂p值?,p值的統計定義 觀察到的顯著水平。 當不存在差異時, 接受Ha,即接受存在差異的概率 導致拒絕零假設的最小值。,這些都是很好的統計定義,但,我如何利用它?,如果 p ,則差異具有統計顯著性。 拒絕零假設,接受存在差異。 將(1-p)看作存在差異的置信度。 舉例1:p = 0.001,則(1 - p
12、) = 0.999或99.9%。 您可以將99.9%看成是存在差異的置信度。 舉例2:p = 0.25,則(1- p) = 0.75或75% 您可以將75%看成是存在差異的置信度。,單樣本 t - 課堂練習,3. 寫出有關設備3的平均值的結論。,設備1的10個部件的高度 5.390 5.389 5.390 5.389 5.388 5.391 5.391 5.391 5.391 5.389,1.計算設備1的95%置信區間的平均值。 n = _ x = _ s = _ df = _ 置信下限 = _ 置信上限 = _ 2.進行假設檢驗,以確定平均值是否顯 著地不同于目標值5.394 Ho: _ H
13、a: _,正態分布對有關平均值的命題有多重要?,根據中心極限定理,平均值趨于正態分布,即使單個變量并不具備正態分布特征。 只要樣本不是太小,而且沒有極端值,正態分布這個前提對于平均值的置信區間和假設檢驗正態分布通常不成問題。,關鍵概念:-第3部分 置信區間與假設檢驗,1. 假設 Ho:事物相同 Ha:事物不同 2. 置信區間:總體參數最可能的取值范圍(與數據一致的值)。 3.平均值 t檢驗是一種假設檢驗,用于將樣本的平均值與目標值或與其它樣本的平均值相比較。 單樣本t檢驗用于將樣本平均值與目標平均值相比較。,關鍵概念:-第3部分 置信區間與假設檢驗,統計風險 錯誤:將實際上相同的事物說成不同(
14、在裝配線上拒絕合格的部件) 風險:出現錯誤的風險 - 習慣上, 風險為5%(或 = 0.05) p值:所觀察到的顯著水平。在總體參數相同的情況下,觀察到顯著差異的概率。,如果觀察到的顯著水平(“ p”)小于可接受的風險(“ ”),則接受 Ha(否定Ho)。,如果觀察到的顯著水平(“ p”)大于可接受的風險(“ ”),則拒絕 Ha (不拒絕Ho)。,附錄,定義假設,零假設假定總體/樣本相同。 公式選擇實際應用 Ho: 1 = 假定設備相同 Ho: 1 - 2 = 0 Ho: 1 = 2 = 3 =.n Ho: 1 = 2 Ho: 1 = 2 = 3 =. n,Ha是可以得到證明的唯一假設!,假設
15、檢驗的九個步驟,1.定義問題/陳述檢驗的目的 2.建立假設 - Ho和 Ha 陳述零假設(Ho):總體的參數相同 陳述備擇假設(Ha ):總體的參數不同 3.確定適當的統計檢驗 (假設的概率分布:t、F、或x2)。 4.陳述可接受的風險和風險水平: 風險: 通常為 5% 風險: 通常為 10-20%,假設檢驗中的九個步驟(續),5.使用檢驗靈敏度(/)確定樣本大小 6.制定抽樣計劃和收集樣本 7.根據數據計算檢驗統計值(t、F或x2) 8.確定所計算的檢驗統計值由于偶然因素引發的概率(p值): 如果概率(p) ,則拒絕Ho并接受 Ha 如果概率(p) ,則不能拒絕Ho(無法得出結論) 9.復制
16、結果,并將統計結論轉換為實際解決方案。,在每個假設檢驗中,我們都在努力證明Ha,有關假設的注解,假設代表了實際問題向統計問題的轉換。在這種方法中,以各種術語來表述實際問題,以使其適于科學檢驗和檢測。實質上,假設就是與給定概率分布的參數相關的命題;如平均值和/或方差。換句話說,假設是這樣一些命題:使我們能夠在進行調查之前提出所有可能的結果。在統計調查之后,我們只需接受或拒絕每個假設,反過來,這些假設又為我們制定現實生活中的實際決策奠定了堅實的基礎。 當以零假設表述時,假設通常的含義與偶發事件的分布相關。這種特殊的假設經常被稱為“ 零假設”,并以“ Ho”表示。通常,它被稱為“名義上的假設。”其意
17、思非常簡單-調查的全體參數相等;也就是說,我們所關心的所有參數(平均值和/或偏差)之間沒有差異。 直接與零假設相對的是備擇假設(Ha)。這類假設一般與非偶發事件的分布相關,因而,被稱之為“統計顯著地不同”于偶發事件的分布,也就是說,觀察到的存在于所調查的樣本參數之間的差異不是源于樣本的隨機偏差。如果觀測到的樣本的差異不是偶發原因所致,我們可以得出結論,從一個或多個方面來說,樣本不同于我們所調查的總體。因此,我們接受不相同的備擇假設,并認為樣本是從其它總體、而不是從我們所調查的總體中 抽取的。 當接受或拒絕零假設和備擇假設時,我們冒已知程度的風險、具有一定的置信度。為此,我們規定(在調查之前)了可接受的決策風險的大小(、)和檢驗靈敏度(/)。一旦選擇完畢,我們就擁有了所需的信息來確定“合理”的樣本大小。用于計算的數學等式確實存在;然而,我們必須將這些計算值與成本、時間和可用資源的實際限制范圍相平衡,以便得出“合理的”抽樣計劃。,t分布的性質,如果總體分布為未知,我們可以通過隨機取樣來進行估計。當樣本為無窮大時,則不存在估算誤差;因此,我們可以應用正態(z)分布來發現偶發事件的概率。然而,隨著樣本大小的降低,我們的不確定性也不斷提高;因此,對于同一概率,我們必須擴大預測的范圍。換句話說,我們必須糾正z來彌
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年會策劃方案模板(18篇)
- 軍訓開幕式學生演講稿2025年(18篇)
- 人機交互測試的基本原則試題及答案
- 反擔保人保證合同書
- 新聞學概論與實務試題集
- 化學工業分析與檢測技術試題
- 培訓服務合同書及課程安排細節說明
- 行政組織的外部環境分析考題及答案
- 公路工程服務體系建設試題及答案
- 計算機三級考試中的易錯試題及答案
- 2025年湖南株洲二中自主招生考試數學試卷試題(含答案詳解)
- 《空調基礎知識培訓》課件
- 關于開展兒童友好醫院建設的實施方案
- 二零二五年度綠色能源合作協議模板3篇
- 污水處理廠工程監理細則
- DB45T 2479-2022 一般固體廢物填埋場水文地質工程地質勘察規范
- 羅漢果簡介課件
- 《常微分方程》期末考試試題庫
- 機電一體化(專業畢業論文)
- 齒輪機構課件
- 結核病定點醫院培訓
評論
0/150
提交評論