第七章 假設檢驗_第1頁
第七章 假設檢驗_第2頁
第七章 假設檢驗_第3頁
第七章 假設檢驗_第4頁
第七章 假設檢驗_第5頁
已閱讀5頁,還剩65頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章假設檢驗1第1頁,課件共70頁,創作于2023年2月一、假設檢驗的提出參數估計是統計推斷的一個主要方面假設檢驗是統計推斷的另一個主要方面參數估計:討論如何根據樣本去得到總體分布所含參數的優良估計假設檢驗:討論怎樣在樣本的基礎上考察上面所得到的估計值與真實值之間在統計意義上相擬合,從而做出一個有較大把握的結論例如:設某廠生產一種燈管,其壽命X~N(,40000),從過去較長一段時間的生產情況看,燈管的平均壽命為=1500小時,現在使用了新工藝后,在所生產的燈管中抽取25只,測得的平均壽命為1675小時,問:采用新工藝后,燈管的壽命是否有顯著提高?拒絕H0(接受H1)--新產品壽命有顯著提高接受H0--新產品的壽命沒有顯著提高H1:新產品的壽命>1500考慮:為判別新產品的壽命是否提高,提出以下兩個假設(hypothesis)H0:新產品的壽命=1500備擇假設(H1)

(alternative

hypothesis)原假設(或零假設H0)(nullhypothesis)注意:一般情況下,我們選取可能或希望成立的假設作為備擇假設(H1),而將其否定形式作為原假設(H0)有時,原假設的選定還要考慮數學上的處理方便假設檢驗問題的處理方法

1、對總體分布中的某些參數或對總體分布的類型做某種假設2、根據樣本值做出接受還是拒絕所做假設的結論2第2頁,課件共70頁,創作于2023年2月【例】一種零件的生產標準是直徑應為10cm,為對生產過程進行控制,質量監測人員定期對一臺加工機床檢查,確定這臺機床生產的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產過程不正常,必須進行調整。試陳述用來檢驗生產過程是否正常的原假設和備擇假設提出假設(例題分析)解:研究者想收集證據予以證明的假設應該是“生產過程不正?!薄=⒌脑僭O和備擇假設為

H0:

10cmH1:

10cm第3頁,課件共70頁,創作于2023年2月【例】某品牌洗滌劑在它的產品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發,有關研究人員要通過抽檢其中的一批產品來驗證該產品制造商的說明是否屬實。試陳述用于檢驗的原假設與備擇假設提出假設(例題分析)解:研究者抽檢的意圖是傾向于證實這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設和備擇假設為

H0:

500H1:

<500500g第4頁,課件共70頁,創作于2023年2月【例】一家研究機構估計,某城市中家庭擁有汽車的比例超過30%。為驗證這一估計是否正確,該研究機構隨機抽取了一個樣本進行檢驗。試陳述用于檢驗的原假設與備擇假設解:研究者想收集證據予以支持的假設是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設和備擇假設為

H0:

30%H1:

30%提出假設(例題分析)第5頁,課件共70頁,創作于2023年2月參數假設檢驗非參數假設檢驗假設檢驗1、假設(hypothesis)

:在數理統計中,把對總體分布的各種論斷稱為統計假設,簡稱為假設(1)、參數假設:關于總體分布中的參數的假設。(2)、非參數假設:不是關于總體分布中的參數的假設如:H0:F(x){對數正態分布族}

H1:F(x){正態分布族}二、假設檢驗的基本概念2、假設檢驗(hypothesistest)

:在數理統計中,稱判斷假設是否成立的方法稱為假設檢驗.依據假設的類型假設檢驗可分為:以下我們主要研究參數假設檢驗問題6第6頁,課件共70頁,創作于2023年2月3、假設檢驗問題a、對總體分布中的某些參數或對總體分布的類型做某種假設b、根據樣本值做出接受還是拒絕所做假設的結論具體地說:(1)如果一個檢驗問題只提出一個假設,而我們的目的也是為了判斷這一假設是否成立,并不同時研究其他假設問題,這類假設檢驗問題成為顯著性檢驗問題(2)一個檢驗問題可能提出兩個甚至更多個假設。如果一個檢驗問題提出兩個假設(設為H0--H1),且二者必居其一,則稱其中一個為基本假設(零假設或原假設),另一個為它的對立假設(備擇假設)本章所討論的假設檢驗問題就是利用樣本的信息在原假設H0與備擇假設H1之間做出拒絕哪一個接受哪一個的判斷,這類假設檢驗問題成為H0對H1的檢驗問題7第7頁,課件共70頁,創作于2023年2月

§7.1.2假設檢驗的基本思想一、檢驗法1、從樣本(X1,

X2,

,

Xn)出發,構造出一個是用于檢驗H0的統計量,并且,當H0成立時,統計量T的分布或漸近分布是已知的,2、制定一個對每一樣本觀測值都可明確的決定拒絕還是接受H0的法則,在樣本值(x1,x2,…,xn)確定之后,按照這個法則做出判斷拒絕H0

,還是拒絕H1,這個法則稱為H0對H1的檢驗法則二、

檢驗法則-------------在樣本值(x1,x2,…,xn)確定之后,統計量的值T也確定了,把統計量的所有可能的取值分為兩個集合E與ē,其中P(T

E)=

(很小),根據小概率事件原理:如果T

E,則拒絕原假設H0(即接受備擇假設H1)如果T

ē,則接受原假設H0(即拒絕備擇假設H1)注意:1、檢驗法則邏輯上運用反證法,統計上依據小概率原理

2、如果是要檢驗參數,統計量T常選為要檢驗的參數的點估計若樣本值(x1,x2,…,xn)

W若樣本值(x1,x2,…,xn)

稱為顯著性水平(Levelofsignificance)(或檢驗水平),

W稱為拒絕域,稱為接受域P((X1,

X2,

,

Xn)

W)=

(很?。颖局?x1,x2,…,xn)分為兩個集合W與8第8頁,課件共70頁,創作于2023年2月假設檢驗的基本思想...因此我們拒絕假設

=50...如果這是總體的真實均值,那么會以較大的概率保證樣本均值距50較近樣本均值m=50抽樣分布H0這個值不像我們應該得到的樣本均值...小概率事件發生了20第9頁,課件共70頁,創作于2023年2月0臨界值顯著性水平a樣本統計量拒絕H0H0成立時的抽樣分布1-

置信水平觀察到的樣本統計量三、假設檢驗問題的一般步驟

1、根據問題的要求提出原假設H0和備擇假設H12、選取檢驗統計量T(X1,

X2,

,

Xn),在H0成立的情形下,確定其分布。對于給定的顯著性水平a,找到H0的拒絕域W和接受域3、如果根據樣本值(x1,x2,…,xn)求出的檢驗統計值T,出現了(x1,x2,…,xn)

W(小概率事件發生了),則拒絕

H0

,否則接受H0顯著性水平a和拒絕域

(右側檢驗)第10頁,課件共70頁,創作于2023年2月顯著性水平a和拒絕域

(左側檢驗)0臨界值a樣本統計量拒絕H0H0成立時的抽樣分布1-

置信水平觀察到的樣本統計量第11頁,課件共70頁,創作于2023年2月顯著性水平

和拒絕域

(雙側檢驗)0臨界值臨界值a/2

a/2

樣本統計量拒絕H0拒絕H0H0成立時的抽樣分布1-

置信水平第12頁,課件共70頁,創作于2023年2月

§7.1.3假設檢驗中的兩類錯誤一、第一類錯誤:拒真

P(拒絕H0|H0為真)=----犯第一類錯誤的概率即P((

x1,x2,…,xn)

W|H0為真)=

假如我們給出了H0對H1的某個檢驗法則,也有了樣本(x1,x2,…,xn)

的拒絕域

W,和接受域,但由于樣本的隨機性,在進行判斷時,還是有可能犯兩類錯誤:二、第二類錯誤:受偽

P(接受H0|H0為假)=

----犯第二類錯誤的概率即P((

x1,x2,…,xn)

|H0為假)=

13第13頁,課件共70頁,創作于2023年2月14第14頁,課件共70頁,創作于2023年2月15第15頁,課件共70頁,創作于2023年2月16第16頁,課件共70頁,創作于2023年2月17第17頁,課件共70頁,創作于2023年2月H0檢驗決策總體情況H0為真H0為假接受H0正確決策(1–a)第Ⅱ類錯誤(b)拒絕H0第Ⅰ類錯誤(a)正確決策(1-b)我們希望進行假設檢驗時,所找到的W能使犯第兩類錯誤的概率都很小,但在樣本容量給定后,要使a、b都很小是不可能的,否則將會導致樣本容量無限增大,這又是不切實際的。基于這種考慮,奈曼與皮爾遜(Neyman-Pearson)提出一個原則即在控制犯第一類錯誤a的條件下,盡量使犯第二類錯誤b?。ㄈ藗兂30丫苷姹仁軅?/p>

看的更重些)18第18頁,課件共70頁,創作于2023年2月§7.2一個正態總體的參數假設檢驗§7.2.1均值

的假設檢驗設總體X~N(,2),考慮參數,2的假設檢驗,檢驗水平為

樣本(X1,X2,…,Xn)來自總體X??紤]均值

的三種形式的假設(1)H0:

=

0

H1:

0(2)H0:

=

0H1:

0(3)H0:

=

0H1:

<

0其中

0是某個給定的數單邊檢驗雙邊假設單邊假設雙邊檢驗19第19頁,課件共70頁,創作于2023年2月一、

2已知(U檢驗法)

設總體X~N(,2),

2=

02已知,

是待檢參數,檢驗水平為

樣本(X1,X2,…,Xn)來自總體X。由于樣本均值是總體

的好的估計量,

是待檢參數,檢驗水平為,(X1,X2,…,Xn)來自總體X。當H0為真時,的取值應在

0

的附近,而所以對X~N(

,

2/n)

即當H0為真時,U的取值應在0的附近,這時,若一次抽樣所得樣本值使得U的值太大或太小,就應該拒絕H00臨界值臨界值a/2

a/2

拒絕H0拒絕H01-

置信水平檢驗水平為

時,對雙側檢驗,拒絕域20第20頁,課件共70頁,創作于2023年2月檢驗水平為

時,拒絕域考慮

2已知時均值

的三種形式的假設(1)H0:

=

0

H1:

0(2)H0:

=

0H1:

0(3)H0:

=

0H1:

<

0其中

0是某個給定的數O

-U

OU

O

/2U

/2

/2-U

/221第21頁,課件共70頁,創作于2023年2月求得U=1.08例1:某廠一車間生產一零件,其直徑據經驗服從N(,5.2),為了檢驗這一車床生產是否正常,現抽取容量為n=100的樣本,樣本均值x=26.56,要求在顯著性水平

=0.05下檢驗雙邊假設H0:

=

26解:方差

2=5.2已知,利用公式而由

=0.05,查標準正態分布表得U

/2=U0.025=1.96可見|U|=1.08<1.96=U

/2=U0.025O/2U/2/2-U/2所以不能拒絕原假設H0:

=

26因而認為生產是正常的22第22頁,課件共70頁,創作于2023年2月求得U=1.08例2:某廠一車間生產一零件,其直徑據經驗服從N(,5.2),為了檢驗這一車床生產是否正常,現抽取容量為n=100的樣本,樣本均值x=26.56,要求在顯著性水平

=0.05下檢驗右邊假設H0:

=

26H1:

>

26解:方差

2=5.2已知,利用公式而由

=0.05,查標準正態分布表得U

=U0.05=1.64可見U=1.08<1.64=U

=U0.05OU

所以不能拒絕原假設H0:

=

26因而認為生產是正常的23第23頁,課件共70頁,創作于2023年2月求得U=1.08例3:某廠一車間生產一零件,其直徑據經驗服從N(,5.2),為了檢驗這一車床生產是否正常,現抽取容量為n=100的樣本,樣本均值x=26.56,要求在顯著性水平

=0.05下檢驗左邊假設H0:

=

26H1:

<26解:方差

2=5.2已知,利用公式而由

=0.05,查標準正態分布表得U

=U0.05=1.64可見-U

=-U0.05=-1.64<

1.08=U所以不能拒絕原假設H0:

=

26因而認為生產是正常的O

-U

24第24頁,課件共70頁,創作于2023年2月二、

2未知(T檢驗法)

設總體X~N(,2),

2=

02未知,

是待檢參數,檢驗水平為

樣本(X1,X2,…,Xn)來自總體X。由于樣本均值是總體

的好的估計量,

是待檢參數,檢驗水平為,(X1,X2,…,Xn)來自總體X。當H0為真時,的取值應在

0

的附近,而

2未知所以自然想到以S代替

X~N(

,

2/n)即當H0為真時,T的取值應在0的附近,這時,若一次抽樣所得樣本值使得T的值太大或太小,就應該拒絕H00臨界值臨界值a/2

a/2

拒絕H0拒絕H01-

置信水平檢驗水平為

時,對雙側檢驗,拒絕域25第25頁,課件共70頁,創作于2023年2月檢驗水平為

時,拒絕域考慮

2未知時均值

的三種形式的假設(1)H0:

=

0

H1:

0(2)H0:

=

0H1:

0(3)H0:

=

0H1:

<

0其中

0是某個給定的數O

-t

Ot

O

/2t

/2

/2-t

/226第26頁,課件共70頁,創作于2023年2月例1:檢驗某種型號玻璃紙的橫向延伸率(%),測得100個數據如表所示假設總體服從正態分布,現在要檢驗假設在顯著性水平

=0.05下檢驗雙邊假設H0:

=65延伸率32.537.539.541.543.545.547.549.5頻數781199121714延伸率51.553.555.557.559.561.563.5頻數5320201而由

=0.05,查t-分布表得t

/2(99)=t0.025(99)

=1.98求得T=34.27可見|T|=34.27>1.98=t

/2=t0.025所以拒絕原假設H0:

=

65因而認為這種型號的玻璃紙沒有達到橫向延伸率的指標解:方差

2未知,利用公式由樣本算出O

/2t

/2

/2-t

/227第27頁,課件共70頁,創作于2023年2月§7.2.2方差

2

的假設檢驗考慮方差

2的三種形式的假設(1)H0:

2

=

02

H1:

2

0

2(2)H0:

2

=

0

2

H1:

2

02(3)H0:

2

=

0

2

H1:

2

<

0

2其中

02是某個給定的數28第28頁,課件共70頁,創作于2023年2月一、

已知(

2檢驗法)

設總體X~N(,2),

=

0已知,

2是待檢參數,檢驗水平為

樣本(X1,X2,…,Xn)來自總體X。由于樣本方差是總體

2的好的估計量,當H0:

2

=

02為真時,S2的取值應在

0

2

的附近,但

=

0已知,所以對S2中的樣本均值,用總體均值替代更加準確,既有即當H0為真時,

2的取值應在n的附近,這時,若一次抽樣所得樣本值使得

2

的值太大或太小,對雙側檢驗,就應該拒絕H0檢驗水平為

時,對雙側檢驗,拒絕域W29第29頁,課件共70頁,創作于2023年2月檢驗水平為

時,拒絕域W考慮方差

2的三種形式的假設(1)H0:

2

=

02

H1:

2

0

2(2)H0:

2

=

0

2

H1:

2

02(3)H0:

2=

0

2

H1:

2

<

0

230第30頁,課件共70頁,創作于2023年2月二、

未知(

2檢驗法)

設總體X~N(,2),

=

0未知,

2是待檢參數,檢驗水平為

樣本(X1,X2,…,Xn)來自總體X。由于樣本方差S2是總體

2的好的估計量,當H0:

2

=

02為真時,S2的取值應在

0

2

的附近,所以對即當H0為真時,

2的取值應在n-1的附近,這時,若一次抽樣所得樣本值使得

2

的值太大或太小,對雙側檢驗,就應該拒絕H0檢驗水平為

時,對雙側檢驗,拒絕域W31第31頁,課件共70頁,創作于2023年2月檢驗水平為

時,拒絕域W考慮方差

2的三種形式的假設(1)H0:

2

=

02

H1:

2

0

2(2)H0:

2

=

0

2

H1:

2

02(3)H0:

2=

0

2

H1:

2

<

0

232第32頁,課件共70頁,創作于2023年2月求得

2=44.5解:利用公式而由

=0.05,查

2分布表得

2

(n-1)=

2

0.05(30)=43.8可見

2=44.5>43.8=

2

0.05(30)所以拒絕原假設H0:

2

=

0.18說明自動機床工作一段時間后精度變差例1:一自動機床加工零件的長度服從N(,

2),原來加工精度為02=0.18,經過一段時間后,要檢驗一下這一車床生產是否保持原來加工精度,即檢驗H0:

2

=

0.18,H1:

2>0.18,為此抽取這車床所加工n=31個零件,測得數據如下表所示,要求在顯著性水平

=0.05下檢驗右邊假設。1371063110.110.310.611.211.511.812.0頻數ni零件長度xi33第33頁,課件共70頁,創作于2023年2月§7.3兩個正態總體的參數假設檢驗§7.3.1兩個正態總體均值的差異性檢驗設樣本(X1,X2,…,Xn1)

來自正態總體X~N(

1,

12),

(Y1,Y2,…,Y

n2)來自正態總體Y~N(

2,

22),并假定X與Y相互獨立,檢驗水平為

考慮三種形式的假設(1)H0:

1=

2

H1:

1

2(2)H0:

1=

2H1:

1

2(3)H0:

1=

2H1:

1

<

2若令

=

1-

2,則變為(1*)H0*:

=

0

H1*:

0(2*)H0*:

=

0

H1*:

0(3*)H0*:

=

0

H1*:

<034第34頁,課件共70頁,創作于2023年2月1、

12,

22都已知樣本(X1,X2,…,Xn1)

來自總體X~N(

1,

12),

(Y1,Y2,…,Y

n2)來自總體Y~N(

2,

22),并假定X與Y相互獨立由于令

=

1-

2,當H0*:

=

0

成立時,有即即當H0*:

=

0

為真時,U的取值在0附近,從而檢驗水平為

時拒絕域W分別由下式得到35第35頁,課件共70頁,創作于2023年2月2、

12,,=

22=

2,但

2未知

由定理(5.10)即當H0*:

=

0

成立時,T的取值在0附近,從而檢驗水平為

時拒絕域W分別見下式O

-t

Ot

O

/2t

/2

/2-t

/236第36頁,課件共70頁,創作于2023年2月解:依題意提出假設H0:

1=

2

H1:

1

2例1:卷煙一廠向化驗室送去A,B兩種煙草,化驗尼古丁的含量是否相同,從A,B中各隨機抽取重量相同的5例進行化驗,測得尼古丁的含量(單位:毫克),并由此得到:拒經驗知,A的尼古丁含量服從N(1,5),B的尼古丁含量服從N(2,8).問兩種煙草的尼古丁平均含量

1、

2是否有差異(

=0.05)由于

12,

22都已知,故利用公式求出U=-1.612而

=0.05,查標準正態分布表得U

/2=U0.025=1.96可見|U|=1.612<1.96=U0.025=U

/2,所以接受原假設H0:

1=

2因而認為兩種煙草的尼古丁平均含量無差異。37第37頁,課件共70頁,創作于2023年2月解:依題意提出假設H0:

1=

2

H1:

1

2例2:為比較A,B兩種型號燈泡的壽命差異,隨機抽取A型燈泡5只,測得,方差S12=965.2,隨機抽取B型燈泡5只,測得,方差S22=1076.2,設總體都是正態的,并且知它們的方差相等.問平均壽命

1、

2是否有差異(

=0.05)利用公式求出T=-0.267而

=0.05,查t-分布表得t

/2(8)=t0.025(8)=2.306可見|T|=0.267<2.306=t0.025=t

/2,所以接受原假設H0:

1=

2因而認為A,B兩種型號燈泡的平均壽命無差異。O

/2t

/2

/2-t

/238第38頁,課件共70頁,創作于2023年2月§7.3.2兩個正態總體方差的差異性檢驗(F-檢驗法)設樣本(X1,X2,…,Xn1)

來自總體X~N(

1,

12),

(Y1,Y2,…,Y

n2)來自總體Y~N(

2,

22),并假定X與Y相互獨立,檢驗水平為

考慮兩種形式的假設(1)H0:

12

=

22

H1:

12

22

(2)H0:

12

22

H1:

12

22

39第39頁,課件共70頁,創作于2023年2月1、

1,

2未知考慮兩種形式的假設(1)H0:

12

=

22

H1:

12

22

(2)H0:

12

22

H1:

12

22

對假設(1)當H0:

12

=

22為真時F的值不能太大或太小從而檢驗水平為

時拒絕域W總體方差的差異性可用樣本方差的比較體現40第40頁,課件共70頁,創作于2023年2月考慮兩種形式的假設(1)H0:

12

=

22

H1:

12

22

(2)H0:

12

22

H1:

12

22

對假設(2)當H0:

12

22為真時F的值不能太大,從而檢驗水平為

時拒絕域W41第41頁,課件共70頁,創作于2023年2月2、

1,

2已知考慮兩種形式的假設(1)H0:

12

=

22

H1:

12

22

(2)H0:

12

22

H1:

12

22

對假設(1)當H0:

12

=

22為真時F的值不能太大或太小從而檢驗水平為

時拒絕域W42第42頁,課件共70頁,創作于2023年2月考慮兩種形式的假設(1)H0:

12

=

22

H1:

12

22

(2)H0:

12

22

H1:

12

22

對假設(2)當H0:

12

22為真時F的值不能太大,從而檢驗水平為

時拒絕域W43第43頁,課件共70頁,創作于2023年2月例1:從兩處煤礦各抽樣數次,分析其含灰率(%),假定各煤礦含灰率,都服從正態分布,依次取容量為5,4的兩獨立樣本,測得樣本方差S12=7.505,S22=2.593,問兩處煤礦的含灰率的方差是否有顯著差異(

=0.05)解:依題意提出假設H0:

12

=

22

H1:

12

22

利用公式求出F2.894而

=0.05,查F分布表得F

/2(4,3)=F0.025(4,3)=15.10可見0.10<2.894<15.10,所以接受原假設H0:

12

=

22因而認為兩處煤礦的含灰率的方差無顯著差異F1-

/2(4,3)=F0.975(4,3)=1/F0.025(3,4)=1/9.980.1044第44頁,課件共70頁,創作于2023年2月例2:有甲乙兩臺車床生產同一型號的滾珠,且這兩臺車床生產的滾珠的直徑服從正態分布,現從這兩臺車床生產的產品中分別8個和9個滾珠,測得直徑(單位:mm),并求得樣本方差S12=0.096,S22=0.026,問甲車床生產的滾珠的直徑的方差是否不超過乙車床(

=0.05)解:依題意提出假設H0:

12

22

H1:

12

22

利用公式求出F3.96而

=0.05,查F分布表得F

(7,8)=F0.05(7,8)=3.50可見F3.96

>3.50=F0.05(7,8),所以拒絕原假設H0:

12

22,接受H1:

12

22,因而認為甲車床生產的滾珠的直徑的方差大于乙車床45第45頁,課件共70頁,創作于2023年2月在上一講中,我們已經了解了假設檢驗的基本思想,并討論了當總體分布為正態時,關于其中未知參數的假設檢驗問題.然而可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對總體分布提出一個假設.第46頁,課件共70頁,創作于2023年2月例如,從1500到1931年的432年間,每年爆發戰爭的次數可以看作一個隨機變量,椐統計,這432年間共爆發了299次戰爭,具體數據如下:戰爭次數X01234

22314248154

發生X次戰爭的年數第47頁,課件共70頁,創作于2023年2月在概率論中,大家對泊松分布產生的一般條件已有所了解,容易想到,每年爆發戰爭的次數,可以用一個泊松隨機變量來近似描述.也就是說,我們可以假設每年爆發戰爭次數分布X近似泊松分布.上面的數據能否證實X具有泊松分布的假設是正確的?現在的問題是:第48頁,課件共70頁,創作于2023年2月又如,某鐘表廠對生產的鐘進行精確性檢查,抽取100個鐘作試驗,撥準后隔24小時以后進行檢查,將每個鐘的誤差(快或慢)按秒記錄下來.問該廠生產的鐘的誤差是否服從正態分布?第49頁,課件共70頁,創作于2023年2月再如,某工廠制造一批骰子,聲稱它是均勻的.為檢驗骰子是否均勻,要把骰子實地投擲若干次,統計各點出現的頻率與1/6的差距.也就是說,在投擲中,出現1點,2點,…,6點的概率都應是1/6.得到的數據能否說明“骰子均勻”的假設是可信的?問題是:第50頁,課件共70頁,創作于2023年2月K.皮爾遜這是一項很重要的工作,不少人把它視為近代統計學的開端.解決這類問題的工具是英國統計學家K.皮爾遜在1900年發表的一篇文章中引進的所謂

檢驗法.第51頁,課件共70頁,創作于2023年2月

檢驗法是在總體X的分布未知時,根據來自總體的樣本,檢驗關于總體分布的假設的一種檢驗方法.第52頁,課件共70頁,創作于2023年2月

H0:總體X的分布函數為F(x)

然后根據樣本的經驗分布和所假設的理論分布之間的吻合程度來決定是否接受原假設.使用

對總體分布進行檢驗時,我們先提出原假設:檢驗法這種檢驗通常稱作擬合優度檢驗,它是一種非參數檢驗.第53頁,課件共70頁,創作于2023年2月在用

檢驗假設H0時,若在H0下分布類型已知,但其參數未知,這時需要先用極大似然估計法估計參數,然后作檢驗.檢驗法分布擬合的

的基本原理和步驟如下:檢驗法第54頁,課件共70頁,創作于2023年2月3.根據所假設的理論分布,可以算出總體X的值落入每個Ai的概率pi,于是npi就是落入Ai的樣本值的理論頻數.1.將總體X的取值范圍分成k個互不重迭的小區間,記作A1,A2,…,Ak.2.把落入第i個小區間Ai的樣本值的個數記作fi,稱為實測頻數.所有實測頻數之和f1+f2+…+fk等于樣本容量n.第55頁,課件共70頁,創作于2023年2月標志著經驗分布與理論分布之間的差異的大小.皮爾遜引進如下統計量表示經驗分布與理論分布之間的差異:統計量的分布是什么?在理論分布已知的條件下,npi是常量實測頻數理論頻數第56頁,課件共70頁,創作于2023年2月皮爾遜證明了如下定理:若原假設中的理論分布F(x)已經完全給定,那么當時,統計量的分布漸近(k-1)個自由度的分布.如果理論分布F(x)中有r個未知參數需用相應的估計量來代替,那么當時,統計量的分布漸近(k-r-1)個自由度的分布.第57頁,課件共70頁,創作于2023年2月為了便于理解,我們對定理作一點直觀的說明.第58頁,課件共70頁,創作于2023年2月是k個近似正態的變量的平方和.這些變量之間存在著一個制約關系:故統計量漸近(k-1)個自由度的分布.在理論分布F(x)完全給定的情況下,每個pi

都是確定的常數.由棣莫佛-拉普拉斯中心極限定理,當n充分大時,實測頻數fi

漸近正態,因此第59頁,課件共70頁,創作于2023年2月在F(x)尚未完全給定的情況下,每個未知參數用相應的估計量代替,就相當于增加一個制約條件,因此,自由度也隨之減少一個.若有r個未知參數需用相應的估計量來代替,自由度就減少r個.此時統計量漸近(k-r-1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論