




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計學分布及假設檢驗第一頁,共七十七頁,2022年,8月28日正態分布第二頁,共七十七頁,2022年,8月28日
正態分布是最常見最重要的一種分布,例如測量誤差;人的生理特征尺寸如身高、體重等;正常情況下生產的產品尺寸:直徑、長度、重量高度等都近似服從正態分布.正態分布的應用與背景
第三頁,共七十七頁,2022年,8月28日
記為分布定義:設
相互獨立,都服從正態分布N(0,1),則稱隨機變量:
所服從的分布為自由度為
n
的分布.第四頁,共七十七頁,2022年,8月28日一般其中,在x>0時收斂,稱為函數的密度函數為自由度為
n的n=2n=3n=5n=10n=15第五頁,共七十七頁,2022年,8月28日t
分布(Student分布)定義則稱T服從自由度為n
的t分布.記為其密度函數為X,Y相互獨立,設t
分布第六頁,共七十七頁,2022年,8月28日t分布的性質1°fn(t)是偶函數,性質n=1n=20t分布的圖形(紅色的是標準正態分布)第七頁,共七十七頁,2022年,8月28日F分布
定義若X~2(n1),Y~2(n2),X,Y相互獨立,則稱隨機變量為第一自由度為n1,第二自由度為n2的F分布(或自由度為),其概率密度為第八頁,共七十七頁,2022年,8月28日第1章假設檢驗§1.1假設檢驗的基本問題§1.2一個正態總體參數的檢驗第九頁,共七十七頁,2022年,8月28日學習目標了解假設檢驗的基本思想掌握假設檢驗的步驟對實際問題作假設檢驗第十頁,共七十七頁,2022年,8月28日根據樣本的信息檢驗關于總體的某個命題是否正確.有參數假設檢驗和非參數假設檢驗這類問題稱作假設檢驗問題.基本概念§1.1
假設檢驗的基本問題第十一頁,共七十七頁,2022年,8月28日假設檢驗的步驟提出假設確定適當的檢驗統計量規定顯著性水平計算檢驗統計量的值作出統計決策第十二頁,共七十七頁,2022年,8月28日提出原假設和備擇假設什么是原假設?(nullhypothesis)待檢驗的假設,又稱“0假設”研究者想收集證據予以反對的假設3. 表示為H0H0:
某一數值指定為=號,即或例如,H0:
3190(克)為什么叫0假設?第十三頁,共七十七頁,2022年,8月28日什么是備擇假設?(alternativehypothesis)與原假設對立的假設,也稱“研究假設”研究者想收集證據予以支持的假設總是有不等號:
,
或表示為H1H1:
<某一數值,或某一數值例如,H1:
<3910(克),或3910(克)提出原假設和備擇假設第十四頁,共七十七頁,2022年,8月28日什么是檢驗統計量?1. 用于假設檢驗決策的統計量2. 選擇統計量的方法與參數估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗統計量的基本形式為確定適當的檢驗統計量第十五頁,共七十七頁,2022年,8月28日規定顯著性水平
(significantlevel)什么顯著性水平?1. 是一個概率值2. 原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3. 表示為(alpha)常用的值有0.01,0.05,0.104. 由研究者事先確定第十六頁,共七十七頁,2022年,8月28日作出統計決策計算檢驗的統計量根據給定的顯著性水平,查表得出相應的臨界值z或z/2,t或t/2將檢驗統計量的值與水平的臨界值進行比較得出拒絕或不拒絕原假設的結論第十七頁,共七十七頁,2022年,8月28日雙側檢驗與單側檢驗
(假設的形式)假設研究的問題雙側檢驗左側檢驗右側檢驗H0m=m0m
m0m
m0H1m≠m0m<m0m>m0第十八頁,共七十七頁,2022年,8月28日單側檢驗
(原假設與備擇假設的確定)將研究者想收集證據予以支持的假設作為備擇假設H1例如,一個研究者總是想證明自己的研究結論是正確的一個銷售商總是想證明供貨商的說法是不正確的備擇假設的方向與想要證明其正確性的方向一致將研究者想收集證據證明其不正確的假設作為原假設H0先確立備擇假設H1第十九頁,共七十七頁,2022年,8月28日單側檢驗
(原假設與備擇假設的確定)一項研究表明,采用新技術生產后,將會使產品的使用壽命明顯延長到1500小時以上。檢驗這一結論是否成立研究者總是想證明自己的研究結論(壽命延長)是正確的備擇假設的方向為“>”(壽命延長)建立的原假設與備擇假設應為
H0:
1500H1:
1500第二十頁,共七十七頁,2022年,8月28日雙側檢驗
(顯著性水平與拒絕域)H0值臨界值臨界值a/2a/2
樣本統計量拒絕域拒絕域抽樣分布1-置信水平第二十一頁,共七十七頁,2022年,8月28日左側檢驗
(顯著性水平與拒絕域)H0值臨界值a樣本統計量拒絕域抽樣分布1-置信水平觀察到的樣本統計量第二十二頁,共七十七頁,2022年,8月28日右側檢驗
(顯著性水平與拒絕域)H0值臨界值a樣本統計量拒絕域抽樣分布1-置信水平觀察到的樣本統計量第二十三頁,共七十七頁,2022年,8月28日§1.2一個正態總體參數的檢驗1.總體均值的檢驗2.總體比例的檢驗3.總體方差的檢驗第二十四頁,共七十七頁,2022年,8月28日一個總體參數的檢驗Z檢驗(單尾和雙尾)
t檢驗(單尾和雙尾)Z檢驗(單尾和雙尾)
2檢驗(單尾和雙尾)均值一個總體比例方差第二十五頁,共七十七頁,2022年,8月28日總體均值的檢驗
(檢驗統計量)總體是否已知?用樣本標準差S代替
t檢驗小樣本容量n否是z檢驗
z檢驗大第二十六頁,共七十七頁,2022年,8月28日總體均值的檢驗
(2
已知或2未知大樣本)1. 假定條件總體服從正態分布若不服從正態分布,可用正態分布來近似(n30)使用Z-統計量2
已知:2
未知:第二十七頁,共七十七頁,2022年,8月28日2
已知均值的檢驗
(例題分析)【例】已知某種玉米平均穗重u0=300g,標準差=9.5g。噴施某種植物生長調節劑后,隨機抽取9個果穗,重量分別308,305,311,298,315,300,321,294,320(g)。問這種調節劑對果穗重量是否有影響?(=0.05)第二十八頁,共七十七頁,2022年,8月28日2
已知均值的檢驗
(例題分析)H0:=300gH1:
300g
=0.05n=9臨界值(s):檢驗統計量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結論:
在
=0.05的水平上拒絕H0認為噴施調節劑能夠顯著增加玉米果穗的重量第二十九頁,共七十七頁,2022年,8月28日2
未知大樣本均值的檢驗
(例題分析)【例】某電子元件批量生產的質量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產的元件質量大大超過規定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產的電子元件質量顯著地高于規定標準?(=0.05)單側檢驗第三十頁,共七十七頁,2022年,8月28日2
未知大樣本均值的檢驗
(例題分析)H0:
1200H1:
>1200=0.05n=100臨界值(s):檢驗統計量:在
=0.05的水平上不拒絕H0不能認為該廠生產的元件壽命顯著地高于1200小時決策:結論:Z0拒絕域0.051.645第三十一頁,共七十七頁,2022年,8月28日總體均值的檢驗
(2未知小樣本)1. 假定條件總體為正態分布2未知,且小樣本2. 使用t
統計量第三十二頁,共七十七頁,2022年,8月28日2
未知小樣本均值的檢驗
(例題分析)【例】某魚塘水中的含氧量多年平均為4.5mg/L。現在該魚塘設10個點采集水樣,測定水中含氧量分別為:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)。試檢驗該次抽樣測定的水中含氧量與多年平均值有無顯著差別?
雙側檢驗第三十三頁,共七十七頁,2022年,8月28日2
未知小樣本均值的檢驗
(例題分析)H0:=4.5H1:
4.5=0.05df=10-1=9臨界值(s):檢驗統計量:在=0.05的水平上接受H0認為該次抽樣測定的含氧量與多年平均含氧量沒有顯著差別。決策:結論:t02.262-2.262.025拒絕H0拒絕H0.025第三十四頁,共七十七頁,2022年,8月28日在R軟件中,函數t.test()提供了t檢驗的功能,使用格式如下:t.test(x,y=NULL,alternative=c("two.sided","less","greater"),mu=0,paired=FALSE,var.equal=FALSE,conf.level=1-α)其中x,y是由數據構成的向量(如果只提供x,則作單個正態總體的均值檢驗,否則作兩個總體的均值檢驗);alternative表示備擇假設,less表示單邊檢驗(H1:u<u0);mu表示原假設u0;var.equal=FALSE表示認為兩總體方差不同,conf.level是置信水平,通常是0.95,即α=0.05第三十五頁,共七十七頁,2022年,8月28日總體比例的檢驗
(Z
檢驗)第三十六頁,共七十七頁,2022年,8月28日一個總體比例檢驗假定條件有兩類結果總體服從二項分布可用正態分布來近似比例檢驗的Z統計量p0為假設的總體比例第三十七頁,共七十七頁,2022年,8月28日一個總體比例的檢驗
(例題分析)【例】有一批蔬菜種子的平均發芽率p0=0.85。現隨機抽取500粒種子,用種衣劑進行浸種處理,結果445粒發芽。試檢驗種衣劑對種子發芽有無效果?雙側檢驗第三十八頁,共七十七頁,2022年,8月28日一個總體比例的檢驗
(例題分析)H0:p=0.85H1:
p
0.85=0.05n=
500臨界值(s):檢驗統計量:在
=0.05的水平上拒絕H0種衣劑對種子發芽率有顯著提高的效果(0.89>0.85)決策:結論:Z01.96-1.96.025拒絕H0拒絕H0.025第三十九頁,共七十七頁,2022年,8月28日方差的卡方(2)檢驗檢驗一個總體的方差或標準差假設總體近似服從正態分布檢驗統計量樣本方差假設的總體方差第四十頁,共七十七頁,2022年,8月28日方差的卡方(2)檢驗
(例題分析)【例】某廠商生產出一種新型的飲料裝瓶機器,按設計要求,該機器裝一瓶一升(1000cm3)的飲料誤差上下不超過1cm3。如果達到設計要求,表明機器的穩定性非常好?,F從該機器裝完的產品中隨機抽取25瓶,分別進行測定(用樣本減1000cm3),得到如下結果。檢驗該機器的性能是否達到設計要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1雙側檢驗第四十一頁,共七十七頁,2022年,8月28日方差的卡方(2)檢驗
(例題分析)H0:2=1H1:2
1=0.05df=25-1=24臨界值(s):統計量:
在
=0.05的水平上不拒絕H0不能認為該機器的性能未達到設計要求
2039.3612.40
/2=.05決策:結論:第四十二頁,共七十七頁,2022年,8月28日§1.3兩個正態總體參數的檢驗檢驗統計量的確定兩個總體均值之差的檢驗兩個總體比例之差的檢驗兩個總體方差比的檢驗檢驗中的匹配樣本第四十三頁,共七十七頁,2022年,8月28日兩個正態總體參數的檢驗兩個總體的檢驗Z
檢驗(大樣本)t
檢驗(小樣本)t
檢驗(小樣本)Z檢驗F
檢驗獨立樣本配對樣本均值比例方差第四十四頁,共七十七頁,2022年,8月28日獨立樣本總體均值之差的檢驗第四十五頁,共七十七頁,2022年,8月28日兩個獨立樣本之差的抽樣分布
m1s1總體1s2
m2總體2抽取簡單隨機樣樣本容量n1計算X1抽取簡單隨機樣樣本容量n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布第四十六頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(12、22
已知)1. 假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布若不是正態分布,可以用正態分布來近似(n130和n230)檢驗統計量為第四十七頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(假設的形式)假設研究的問題沒有差異有差異均值1均值2均值1<均值2均值1均值2均值1>均值2H0
1–2=0
1–20
1–20H1
1–20
1–2<0
1–2>0第四十八頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(例題分析)
【例】現用甲、乙兩種發酵法生產青霉素,其產品收率的方差分別為
=0.46(g/L)2,=0.37(g/L)2。現甲方法測得25個數據,=3.71g/L;乙方法測得30個數據,=3.46g/L。問甲、乙兩種方法的收率是否相同?(=0.05)第四十九頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(例題分析)H0:1-2=0H1:1-2
0=0.05n1=25,n2
=
30臨界值(s):檢驗統計量:決策:結論:
在=0.05的水平上接受H0甲、乙兩種方法的收率相同,沒有顯著差異Z01.96-1.96.025拒絕H0拒絕H0.025第五十頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(12、22
未知且相等,小樣本)檢驗具有不等方差的兩個總體的均值假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布兩個總體方差未知且相等12=22檢驗統計量其中:第五十一頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(12、22未知但不相等,小樣本)檢驗具有等方差的兩個總體的均值假定條件兩個樣本是獨立的隨機樣本兩個總體都是正態分布兩個總體方差未知但不相等12=22檢驗統計量(n1≠n2,用近似的t檢驗)第五十二頁,共七十七頁,2022年,8月28日當n1=n2=n時,仍可用t檢驗法,其計算也與兩個總體方差相等的情況一樣,只是自由度df=n-1當n1≠n2時,其自由度df計算方式如下:第五十三頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(例題分析)【例】用高蛋白和低蛋白兩種飼料飼料1月齡大白鼠,在3個月時,測定兩組大白鼠的增重量(g),
兩組數據如下:高蛋白組:134,146,106,119,124,161,107,83,113,129,97,123低蛋白組:70,118,101,85,107,132,94試問兩種飼料飼養的大白鼠增重量是否有差別?第五十四頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(該題由后面的F檢驗可以得出兩總體方差相等)H0:
1-2
=
0H1:1-2
≠0=
0.05n1=12,n2
=
7臨界值(s):檢驗統計量:決策:結論:
在=0.05的水平上接受H0認為兩種飼料飼養的大白鼠增重量沒有顯著差別Z01.96-1.96.025拒絕H0拒絕H0.025第五十五頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(匹配樣本的t
檢驗)1. 檢驗兩個總體的均值配對或匹配重復測量(前/后)2. 假定條件兩個總體都服從正態分布如果不服從正態分布,可用正態分布來近似(n1
30,n230)第五十六頁,共七十七頁,2022年,8月28日匹配樣本的t
檢驗
(假設的形式)假設研究的問題沒有差異有差異總體1總體2總體1<總體2總體1總體2總體1>總體2H0mD=0mD0mD0H1mD0mD<0mD>0注:Di=X1i-X2i
,對第i對觀察值第五十七頁,共七十七頁,2022年,8月28日匹配樣本的t
檢驗
(數據形式)
觀察序號樣本1樣本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n第五十八頁,共七十七頁,2022年,8月28日匹配樣本的t
檢驗
(檢驗統計量)樣本差值均值樣本差值標準差自由度df=nD-1統計量D0:假設的差值第五十九頁,共七十七頁,2022年,8月28日【例】一個以減肥為主要目標的健美俱樂部聲稱,參加其訓練班至少可以使減肥者平均體重減重8.5kg以上。為了驗證該宣稱是否可信,調查人員隨機抽取了10名參加者,得到他們的體重記錄如下表:匹配樣本的t
檢驗
(例題分析)在
=0.05的顯著性水平下,調查結果是否支持該俱樂部的聲稱?訓練前94.5101110103.59788.596.5101104116.5訓練后8589.5101.5968680.58793.593102單側檢驗第六十頁,共七十七頁,2022年,8月28日樣本差值計算表訓練前訓練后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合計—98.5配對樣本的t
檢驗
(例題分析)第六十一頁,共七十七頁,2022年,8月28日配對樣本的t
檢驗
(例題分析)差值均值差值標準差第六十二頁,共七十七頁,2022年,8月28日H0:
m1–m2
8.5H1:
m1–m2
<8.5a=0.05df=
10-1=9臨界值(s):檢驗統計量:決策:結論:
在
=0.05的水平上不拒絕H0不能認為該俱樂部的宣稱不可信配對樣本的t
檢驗
(例題分析)-1.833t0拒絕域.05第六十三頁,共七十七頁,2022年,8月28日兩個總體比例之差的檢驗第六十四頁,共七十七頁,2022年,8月28日1. 假定條件兩個總體是獨立的兩個總體都服從二項分布可以用正態分布來近似檢驗統計量兩個總體比例之差的Z檢驗第六十五頁,共七十七頁,2022年,8月28日兩個總體比例之差的檢驗
(假設的形式)假設研究的問題沒有差異有差異比例1≥比例2比例1<比例2總體1≤比例2總體1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0第六十六頁,共七十七頁,2022年,8月28日兩個總體比例之差的Z檢驗
(例題分析)
【例】現研究地勢對小麥銹病發病率的影響。調查低洼地麥田378株,其中銹病株342株;調查高坡地麥田396株,其中銹病株313株。比較兩塊地麥田銹病發病率是否有顯著性差異?第六十七頁,共七十七頁,2022年,8月28日兩個總體比例之差的Z檢驗
(例題分析)H0:P1-P2
=0H1:P1-P2
≠0=0.05n1=378,n2
=
396臨界值(s):檢驗統計量:決策:結論:
在
=0.05的水平上拒絕H0低洼地麥田銹病發病率顯著高于高坡地麥田Z01.96-1.96.025拒絕H0拒絕H0.025第六十八頁,共七十七頁,2022年,8月28日兩個總體方差比的檢驗
(F
檢驗)假定條件兩個總體都服從正態分布兩個獨立的隨機樣本假定形式H0:s12=s22
或H0:s12
s22
(或
)H1:s12
s22H1:s12
<s22
(或>)檢驗統計量F=S12/S22~F(n1–1,n2–1)第六十九頁,共七十七頁,2022年,8月28日兩個總體均值之差的檢驗
(例題分析)【例】用高蛋白和低蛋白兩種飼料飼料1月齡大白鼠,在3個月時,測定兩組大白鼠的增重量(g),
兩組數據如下:高蛋白組:134,146,106,119,124,161,107,83,113,129,97,123低蛋白組:70,118,101,85,107,132,94試問這兩個總體的方差是否有顯著差異?第七十頁,共七十七頁,2022年,8月28日兩個總體方差的F
檢驗
(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高壓安全培訓
- 常見呼吸道傳染病防治要點
- 福建省龍巖市龍巖市一級校2024-2025學年高一下學期4月期中 英語試題(含答案無聽力音頻含聽力原文)
- 一年級上冊人美版美術線上教學計劃
- 2025年反腐倡廉警示教育片帶給我的思考
- 小學口風琴社團年度總結與計劃
- 天津市2025年中考志愿填報指導及范文
- 十年(2014-2023)高考化學真題分項匯編(全國)專題62 難溶電解質的溶解平衡(含答案或解析)
- 建筑施工安全風險應對措施
- 酒店業環境管理體系與措施
- 2025購銷茶葉合同范本
- 山東濟南歷年中考作文題與審題指導(2005-2021)
- 職業技術學院2024級工業互聯網技術專業人才培養方案
- 锝99mTc替曲膦注射液-藥品臨床應用解讀
- 武漢各區2023-2024學年九下化學四調壓軸題分類匯編-第8題選擇題
- 腦血管造影術的術前及術后護理
- 外墻涂料施工勞務合同范本(8篇)
- 成人重癥患者顱內壓增高防控護理專家共識2024
- 網絡災難與信息安全應急
- 音樂人類學視角-洞察分析
- 中職語文職業模塊期末綜合測試題(三)
評論
0/150
提交評論