第7章假設檢驗_第1頁
第7章假設檢驗_第2頁
第7章假設檢驗_第3頁
第7章假設檢驗_第4頁
第7章假設檢驗_第5頁
已閱讀5頁,還剩118頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第七章 假設檢驗假設檢驗的基本原理總體參數假設檢驗非參數檢驗第一節 假設檢驗的基本原理假設檢驗的基本原理假設檢驗的規則與兩類錯誤檢驗功效一、假設檢驗的基本原理假設檢驗是統計推斷的另一項重要組成部分,是參數估計的延續,是對參數估計在統計上的驗證與補充。它首先對考察總體的分布形式或總體的某些未知參數事先做出某些假設,然后根據檢驗對象構造合適的檢驗統計量并經過數理統計分析,確定在假設下,該檢驗統計量的抽樣分布;在給定的顯著性水平下,從抽樣分布中得出鑒別對原先假設的拒絕域和接受域的臨界值;之后由所抽取的樣本資料計算樣本統計量,并將樣本統計量與臨界統計量進行比較,從而對所提出的原假設做出統計判斷:是接受

2、還是拒絕原假設。也就是從樣本中所蘊含的信息來對總體情況進行判斷。假設檢驗所遵循的推斷依據是統計中的“小概率原理”:小概率事件在一次試驗中幾乎是不會發生的。舉個例子來說,在10000件的產品中,如果只有1件是次品,那么可以得知,在一次試驗中隨機抽取1件產品,它為次品的概率就為01.01,此概率是非常小的。或者是說,在一次隨機抽樣試驗中,次品幾乎是不會被抽到的。反過來,如果從這批產品中隨機抽取1件,恰好是次品,那么,我們就有理由懷疑該批產品的次品率不是很小,否則就不會那么容易地抽到次品。因此,有足夠的理由否認該批產品的次品率很低的假設。通常概率要多大才能算得上是小概率呢?假設檢驗中把這個小概率稱為

3、顯著性水平 ,其取值的大小與我們能否做出正確判斷有著相當大的關系。然而, 的取值并沒有固定的標準,只能根據實際需要來確定。一般地, 取0.085(5),對于一些比較嚴格的情況,例如在一些高精密質量檢驗的假設檢驗中,它可以取0.01或者更小。 越小,所做出的拒絕原假設的判斷的說服力就越強。當然,不管 有多么地小,也不能代表小概率事件沒有發生的可能,這也正是假設檢驗與數學上“反證法”的不同之處。所以,對于拒絕或者接受,都只是統計意義上的,并不是完全意義上的。這一點在學習假設檢驗過程中是容易被疏忽的。事先建立假設,是假設檢驗中關鍵的一項工作。它包括原假設和備選假設兩部分。原假設是建立在假定原來總體沒

4、有發生變化的基礎之上的,也就是總體參數沒有顯著變化。備選假設是原假設的對立,是在否認原假設之后所要接受的內容,通常這是我們真正感興趣的一個判斷。例如在上面的例子中,如果想確認次品率是否為0.01,我們可以分別建立原假設和備選假設為: h0:0=0.01%, h1:00.01% ;如果我們想確認次品率是否大于(小于)0.01,那么對應的備選假設為: h1:0>0.01% (或0<0.01% ),原假設與前面相同。由此可見,備選假設與原假設的建立不是隨意的,而是要根據研究的需要來確定的。應當指出,在假設檢驗中,相對而言,當原假設被拒絕時,我們能夠以較大的把握肯定備選假設的成立;而當原假

5、設不能被拒絕時,我們并不能斷定原假設確實成立。例如,當給定的為0.01時,如果檢驗統計量的取值落入其發生概率不超過0.04但又大于0.01的區域時,我們不能拒絕原假設。但事實上,在原假設成立的前提下,其發生的概率最多只有0.04,因此難以斷定原假設成立。如果將顯著水平定為0.05,則原假設就會被拒絕。假設檢驗按照所檢驗內容的不同,可以分為參數檢驗和非參數檢驗。對已知總體分布的某個未知參數進行的檢驗,稱為參數檢驗;對總體的分布形式進行的檢驗,則稱為非參數檢驗。本章將分別對這兩類檢驗進行介紹。二、假設檢驗的規則與兩類錯誤(一)假設檢驗的規則綜合上面假設檢驗的原理分析,給出假設檢驗的步驟:1根據實際

6、應用問題確定合適的原假設 h0和備選假設h1;2確定檢驗統計量,通過數理統計分析確定該統計量的抽樣分布;3給定檢驗的顯著性水平 ,在原假設成立的條件下,結合備選假設的定義,由檢驗統計量的抽樣分布情況求出相應的臨界值,該臨界值為原假設的接受域與拒絕域的分界值;4從樣本資料計算檢驗的樣本統計量,并將其與臨界值進行比較,判斷是否接受或拒絕原假設。上面步驟中,對檢驗統計量抽樣分布的確認屬于高深的概率數理統計的研究內容,本處我們不作探討。從檢驗程序我們可以看出,統計量的取值范圍可以分為接受域和拒絕域兩個區域。拒絕域正就是統計量取值的小概率區域。按照我們將這個拒絕域安排在所檢驗統計量的抽樣分布的某一側還是

7、兩端,可以將檢驗分為單側檢驗和雙側檢驗。單側檢驗中,又可以根據拒絕域,是在左側還是在右側而分為左側檢驗和右側檢驗。對于上述的情況,我們可以通過服從檢驗統計量的分布圖來形象表示: 圖7-1 雙側檢驗與單側檢驗圖中的陰影部分為拒絕域,對應的分別是雙側、左單側、右單側檢驗。實際應用中,是采用雙側檢驗還是單側檢驗?單側檢驗中,是采用左單側還是右單側呢?例如,某公司采取了新的銷售方案,我們想檢驗新方案下銷售收入是否與實施前的有差異,即是否等同于原來的銷售收入水平,對該情況的檢驗就是雙側檢驗。如果我們想檢驗新方案下的銷售收入水平是否有所提高,此時檢驗就轉化為單側檢驗了,而且是右側檢驗。同理,如果想檢驗收入

8、水平是否低于實施前的收入水平,就要采用單側檢驗中的左側檢驗。也就是說,選用雙側、左側或右側檢驗時,要結合備選假設來考慮。又如,前面提到的次品率的例子中,如果備選假設為 h1:00.01% ,就是雙側檢驗;如果備選假設為h1:0<(或>) 0.01% ,就是屬于左(右)單側檢驗。在檢驗規則中,我們經常碰到兩種重要的檢驗方法: z檢驗與t檢驗。1z檢驗。又稱為正態分布檢驗,該檢驗認為所檢驗的統計量服從正態分布。例如,從正態分布總體中抽取一個樣本,則樣本均值 服從正態分布 ;從一般非正態分布總體中抽樣,當樣本容量 n很大時,樣本均值 近似地服從正態分布 ,其中 , , 為總體標準差。因為

9、統計量 n(0,1) ,所以,我們可以利用標準正態分布來進行檢驗。根據給定的顯著性水平,從標準正態分布的臨界表中查得臨界值 ,將 z統計量的取值與臨界值比較來判斷能否拒絕原假設。2 t檢驗。在檢驗中,當總體的標準差 未知時,需要用樣本標準差 來代替,從而構成統計量 。同樣,從 t分布的臨界表中查得臨界值 ,并將樣本統計量的 值與其比較做出判斷。(二) p值檢驗在上面的檢驗步驟中,判斷最后是接受原假設還是拒絕原假設依據是,計算的樣本統計量的數值與檢驗統計量的臨界值的大小比較。此外,我們也可以根據計算的概率值p來判斷能否拒絕原假設,這就是p值檢驗。現在在眾多流行的統計計量軟件中(如sas,spss

10、,excel等),最后的結果表中都給出了p值。p值檢驗的原理:建立原假設后,在假定原假設成立的情況下,參照備選假設,可以計算出檢驗統計量超過或者小于(還要依照分布的不同、單側檢驗、雙側檢驗的差異而定)由樣本所計算出的檢驗統計量的數值的概率,這便是p值;而后將此p值與事先給出的顯著性水平 進行比較,如果p值小于,也就是說,原假設對應的為小概率事件,根據上述的“小概率原理”,我們就可以否定原假設,而接受對應的備選假設。如果 p 值大于 ,我們不就能否定原假設。例如,對應上面的 檢驗中,如果是雙側檢驗,根據上面的說明,可以計算 ,若 p,那么我們就可以否認原假設,反之不能否定原假設。 p值檢驗與前面

11、介紹的方法得出的結論是一致的。(三)兩類錯誤在假設檢驗中,對假設的檢驗判斷是依據樣本實際資料所計算的統計量的值與臨界值的比較來做出的。由于樣本的隨機性、樣本信息的分散性等原因,這種合理的“以偏概全”式的假設檢驗,總是無法讓我們百分百的肯定所做出結論的正確性。也就是說,我們有可能會做出錯誤的判斷,這種風險是客觀存在的。例如,實際上依據真實總體情況,我們應該接受原假設h0,但根據樣本信息,卻做出拒絕h0的錯誤結論,稱這種錯誤為“棄真”錯誤;此外,我們也可能犯這樣的錯誤:實際的總體情況是應該拒絕原假設,而我們卻接受了它,稱此為“納偽”錯誤。對于上述的兩類錯誤,我們都希望能盡量減少其發生的概率。因此需

12、要對它們的概率進行簡要分析。在假設中,我們給出了顯著性水平(概率值),在“小概率事件是幾乎不會發生的”原理上,如果樣本資料的信息與總體信息之間的差異出現的概率小于等于 ,那么可以認為在一次試驗中該事件不會發生(發生的可能性很小),從而我們就拒絕了原假設。這就是說,有的可能性發生原假設是真實的卻被拒絕的情況。所以顯著性水平就是我們犯“棄真”錯誤的可能性大小。 越小,則犯“棄真”錯誤的可能性就越小。因而,可以根據實際需要對顯著性水平加以控制,一般取 =0.05(或者=0.1 ),這就保證犯“棄真”錯誤的可能性不超過5(或者1)。如果要求更加嚴格, 可取更小的數值。通常記為犯“納偽”錯誤的可能性大小

13、。由于兩類錯誤是一對矛盾,在其他條件不變的情況下,減少犯“棄真”錯誤的可能性( ),勢必增大犯“納偽”錯誤的可能性( ),也就是說, 的大小和顯著性水平的大小成相反方向變化。兩類錯誤發生的概率 的相對關系可由下面的圖形來表示:圖7-2 兩類錯誤從圖7-2中,我們也可以看出,當真實分布與待判別分布越遠離時,在一定下,將越小;也就是說,當差別比較明顯時,我們犯錯誤的可能性會更小,反之亦然。假設三、檢驗功效由于為犯“納偽”錯誤的可能性大小,或者說 表示出現接受不真實的原假設的結論的概率,那么1- 就是指出現拒絕不真實的原假設的概率。若1- 的數值越接近于1,表明不真實的原假設幾乎都能夠被拒絕。誠然,

14、如果1- 的數值接近于0,表明犯“納偽”錯誤的可能性很大。因此, 1- 可以用來表明所做假設檢驗工作好壞的一個指標,我們稱之為檢驗功效。它的數值表明我們做出正確決策的概率為1- 。一個好的檢驗法則總是希望犯兩類錯誤的可能性與都很小,但是這在一般場合下是很難實現的。要使得小,必然導致大,若要使 小,必導致增大。在實際檢驗中,一般首先控制犯“棄真”錯誤的概率,也就是事先給出的顯著性水平的數值盡量地小,在其它條件不變的情況下,增加犯“納偽”錯誤的可能性,即增大,從而使得檢驗功效(1- )減弱。在此情況下,如何增強檢驗功效?解決的唯一辦法只有增大樣本容量,這樣既能保證滿足取得較小的 ,又能取得較小的值

15、,一舉兩得。然而實際上樣本容量的取得是有限制的,只能根據實際來確定。第二節 總體參數假設檢驗總體均值的假設檢驗兩個總體均值之差的檢驗總體成數的假設檢驗總體均值的假設檢驗兩個正態總體方差比的檢驗總體參數假設檢驗就是檢驗已知分布形式(本節主要考慮正態分布)的總體的某些參數(例如均值或者方差)是否與事先所做的假設存在顯著性差異,又稱為顯著性檢驗。主要包括對總體均值和總體方差的假設檢驗。本節分各種情況對這兩方面的檢驗進行介紹。一、總體均值的假設檢驗總體均值的假設檢驗就是檢驗由樣本信息所推斷的當前總體均值是否與事先假設的總體均值存在顯著性差異。設樣本x1,x2,xn來自于正態總體n(,2 ),樣本均值為

16、 ,樣本的標準差為s2 ,對于均值的檢驗問題。(一)總體方差2已知對于雙側檢驗,建立的假設為:h0:=0, h1:0其中 為一個給定已知的常數。對于左(右)單側檢驗來說,建立的假設為:h0:=0, h1:<(或>)0可以利用上面介紹過的z檢驗法,構造檢驗統計量 (7.1)在原假設成立的條件下,該統計量的分布為:z n(0,1)。從而在給定的顯著性水平下,我們可從標準正態分布表中查得臨界值 (對應于左、右單側檢驗的臨界值分別為- z1-和z1-)。根據樣本資料及假設,計算出樣本統計量的值z。這樣,我們便可以得出原假設的拒絕域為: (對雙側檢驗而言)z<-z1-(對于左單側檢驗而

17、言)z>z1-(對于右單側檢驗而言)當z值處于拒絕域中時,我們就可拒絕原假設,否則不能拒絕原假設。(二)總體方差2未知總體方差2未知時對于均值的假設檢驗,類似上面方差2已知時的做法。對于雙側檢驗,建立的假設為:h0:=0, h1:0對于左(右)單側檢驗來說,建立的假設為: h0:=0, h1:<(或>)0只是在構造檢驗統計量時,不是利用z檢驗法。而是在原假設成立的條件下,利用t檢驗法,構造檢驗統計量t(n-1)(7.2)其中 為樣本標準差。t統計量就是用樣本標準差s來代替z統計量中未知的總體標準差。對于臨界值,在t分布表中查得臨界值 (雙側檢驗)、 -t1-(n-1) (左單

18、側檢驗)、 t1-(n-1) (右單側檢驗)。根據樣本資料及假設,計算出樣本統計量的值t。這樣,可以得出對原假設的拒絕域為:樣本統計量的值t滿足(雙側檢驗)t<-t1-(n-1)(左單側檢驗)t>t1-(n-1)(右單側檢驗)當t值落入拒絕域,就拒絕原假設,否則不能拒絕原假設。這里應該注意的是,在實際中不能夠確定總體是否滿足正態分布,但是樣本容量n很大。根據中心極限定理,該總體分布近似服從正態分布,對該總體均值的檢驗可以依據上面的總體方差未知的程序來進行。對于小樣本情況,我們也是根據上面的t檢驗來進行。【例7-1】為了考察某種類型的電子元件的使用壽命情況,假定該電子元件使用壽命的分

19、布為正態分布。而且根據歷史記錄得知該分布的參數為:平均使用壽命為100(小時),標準差 =10(小時)。現在隨機抽取100個該類型的元件,測得平均壽命為102(小時),給定顯著性水平=0.05 ,問該類型的電子元件的使用壽命是否有明顯的提高。解:此題為單側檢驗,且是右單側檢驗。以表示元件的平均使用壽命(小時),則(1)建立假設h0:= 100,即平均使用壽命無明顯變化;h1:>100 ,即使用壽命有明顯提高。(2)確定檢驗統計量及其分布 n(0,1)(3)確定臨界值右單側檢驗的臨界值為z 。由于給定的顯著性水平=0.05,那么雙側概率水平為20.050.1,則f(z )=1-0.1=0.

20、9,查正態分布表得到z =1.645,即為臨界值。(4)計算樣本統計量并判斷根據樣本資料,計算樣本統計量:由于計算的樣本統計量z>1.645,所以拒絕原假設h0 ,可以認為該類型的電子元件的使用壽命確實有所提高。【例7-2】在上例中,如果抽出的100個樣本元件,測得其平均使用壽命為98(小時),其余條件相同,試問該類型元件的使用壽命是否有顯著性下降。解:此例為左單側檢驗問題。(1)建立的假設檢驗為h0:=100,無明顯變化; h1:<100 ,有顯著性下降。(2)確定檢驗統計量及其分布在原假設成立下,檢驗統計量為: n(0,1)(3)確定臨界值此時左側臨界值為- z,根據上面的結果

21、,得到臨界值為-z=-1.645(4)計算樣本統計量并做出判斷:樣本統計量為:由于-z<-1.645 ,所以拒絕原假設h0 ,說明該類型元件的使用壽命有顯著性下降。【例7-3】某糖果生產基地,生產的標準是每袋糖果的凈重為500(克)。今從一批生產中抽出10袋,實際測得每袋糖果的凈重(克)為:512 503 498 507 496 489 499 501 496 506給定顯著性水平=0.01,試問該批的生產是否正常。解:該例中,所檢驗問題是糖果凈重是否符合500克的標準,屬于雙側檢驗問題。(1)建立假設h0:=500, h1: 500(2)確定臨界值由于是雙側檢驗,所以應該有兩個臨界值:

22、上臨界值、下臨界值。又因總體的標準差未知,需要用樣本標準差s來代替,因此,統計量服從的是自由度=n-1的t分布,而非正態分布。此例中n=10, =0.01 ,則自由度=10-1=9 ,查t分布表得到,上臨界值t/2()=t0.005(9)=3.25,由于分布的對稱性,下臨界值為t/2()=t0.005(9)=3.25。(3)計算樣本統計量在計算樣本統計量之前需要先計算樣本均值和樣本標準差:樣本均值: (克)樣本標準差: (克)檢驗的樣本統計量:(4)判斷:根據樣本計算的統計量t=0.335-3.25,3-25,所以不能拒絕原假設,也即,在99的置信度下,可以認為該批生產正常。【例7-4】承上例

23、,假定所要檢驗的是該批生產是否顯著地高于標準。解:這樣檢驗問題就變為單側檢驗了,而且是右單側問題。(1)建立假設h0:500, h1:>500(2)確定臨界值由于是屬于單側檢驗,所以只有一個臨界值;n=10,=0.01,查表得到該臨界值為 t ()=t0.01(9)=2.821(3)計算樣本統計量跟上例的計算一樣,此處略,得到樣本統計量t=0.335 (4)判斷由于實際的樣本統計量t=0.335 <臨界值t0.01(9)=2.821 ,所以不能拒絕原假設,可以認為該類生產沒有顯著地高于標準。該結論與上例的結論相符。二、兩個總體均值之差的檢驗兩個總體均值之差的檢驗,就是對兩個不同總體

24、的均值之間的差異性是否顯著所進行的檢驗。為了分析的簡化與方便,我們假定x是取自于均值為x 、方差為的正態總體x的一個樣本,y是取自于均值為 y 、方差為 的正態總體y的一個樣本,樣本容量分別為 ,且假定此兩樣本相互獨立。 、為對應的樣本均值與樣本方差,顯著性水平為。下面我們分總體方差已知和未知兩種情況,來分析總體均值的差異顯著性檢驗。(一)兩總體方差 已知 雙側檢驗原假設為h0:x=y,備選假設為 h1:xy根據上面的假定和抽樣分布理論,我們可以得到: n(0,1) (7.3)所以在原假設成立下,構造的檢驗統計量為: n(0,1) (7.4)在顯著性水平下,我們查標準正態分布表得到臨界值 。將

25、樣本資料代入所構造的檢驗統計量,得到樣本統計量z。若 ,則拒絕原假設;反之,則不能拒絕原假設。 左單側檢驗原假設為h0:x=y,備選假設為 h1:x<y此時可從標準正態分布表查得的臨界值為z1- 。檢驗的拒絕域為: z<-z1-。 右單側檢驗原假設為h0:x=y ,備選假設變為h1:x<y此時的臨界值也為z1-。檢驗的拒絕域為: z>z1- 。(二)兩總體方差 未知但相等在兩方差未知但相等的情況下,我們根據抽樣分布理論知: t(n1+n2-2) (7.5)對于雙、單側檢驗,原假設都是相同的,均為h0:x=y。只是在雙側檢驗時,備選假設h1:xy ;在左單側檢驗時,備選假

26、設為h1:x<y ;在右單側檢驗時,備選假設為h1:x>y 。在原假設成立的情況下,根據上面的公式,我們可以構造如下的檢驗統計量: t(n1+n2-2) (7.6)可以根據樣本資料的數據,計算樣本檢驗統計量的數值。對于雙側檢驗,可以從t分布表中查得臨界值 ,此時原假設的拒絕域為: 。反之就不能拒絕原假設。對于左、右單側檢驗,從 分布表中查得臨界值t1-(n1+n2-2);左單側檢驗拒絕原假設的范圍是:t<- t1-(n1+n2-2)。右單側檢驗拒絕原假設的范圍為:t<- t1-(n1+n2-2)。若t在拒絕域之外,則不能拒絕原假設。【例7-5】將某小學一年級學生隨機分為

27、兩組,對其中一組運用新型的教學方式,稱為新型組,另一組按照傳統的教學方式稱為傳統組。經過六個月后,對該年級學生進行成績測試。假設兩組成績的總體標準差相同。從新型組抽取31名學生,求得其平均成績為78.06,標準差為9.36;同樣的,從傳統組抽取31名,求得的平均成績為76.30,標準差為10.12。假設兩組成績的總體標準差相同。比較兩組學生的平均成績是否有顯著性差異。解:此題屬于在兩總體方差未知(但是假定兩方差相等)下,檢驗兩組均值是否有差異的問題。依題意有,(1)建立假設。h0:x=y,備選假設h1:xy ;(2)構造檢驗統計量為t (n+n2-2) 其中由于相等的標準差未知,我們用來估計。

28、(3)確定臨界值。從t分布表中查得臨界值 。(4)計算樣本統計量及判斷。將樣本資料代入檢驗統計量得到 因而有 ,不能拒絕原假設,即兩組的均值沒有顯著性差異。三、總體成數的假設檢驗成數是反應現象數量結構的指標。例如就業率、升學率、產品合格率等等。要考察總體成數是否發生顯著性變化,可以通過樣本成數來對其進行假設檢驗。與對總體均值的假設檢驗類似,總體成數的假設檢驗包括單樣本和多樣本(本處只考慮兩樣本情況)總體成數檢驗。(一)單樣本成數檢驗當樣本容量比較大時,按照中心極限定理,分布以正態分布為極限。因而,對總體成數的假設檢驗可以借助正態分布來進行。建立假設: ,構建的檢驗統計量為 (7.7)服從標準正

29、態分布,即 z n(0,1)其中,p代表樣本的成數,代表總體的成數。, 對于顯著性水平 ,可以通過查標準正態分布表,得到臨界值 。從樣本數據中計算得出 樣本成數p代入檢驗統計量,得到樣本統計量 z。將樣本統計量與臨界值進行比較,若 ,則拒絕原假設;反之則不能拒絕原假設。當然,如果對應的原假設是單邊的,即h0: (或)0,則對應的臨界值是z1-。若 ,則拒絕原假設;反之,則不能拒絕原假設。我們以例子來說明單樣本成數檢驗的過程。【例7-6】某牌子的冰箱生產商聲明,其產品在該地區的市場占有率為60。為了檢驗該說法的正確與否,我們在該地區隨機調查了100名購買了冰箱的消費者,其中有57人購買的是該牌子

30、的冰箱,試問該生產商的聲明是否可靠?(=0.05)解:經分析,本例屬于雙側檢驗。樣本市場占有率 (1)建立假設: h0:=60%, h1:60%(2)檢驗統計量: n(0,1)(3)計算臨界值:在5的顯著性水平下,從標準正態分布表中可以查得臨界值為: (4)計算樣本統計量及判斷: 樣本統計量 ,因而,我們不能拒絕原假設,即生產商的聲明是可靠的。(二)兩個樣本總體成數差的檢驗如果要考察兩個總體的成數之間是否有顯著性差異,可以用兩樣本總體成數差檢驗。假定對應兩總體的樣本容量分別為n1、n2,當 n1、n2都比較大時,我們可以構造如下的檢驗統計量,該檢驗統計量服從標準正態分布。 n(0,1) (7.

31、8)若建立的原假設為 h0:1=2,相應的臨界值為 ;若建立的原假設為h0:1(或)2,則相應的臨界值為z1- 。能否拒絕原假設的判斷規則如前面所述。【例7-7】考察專業股票分析師和普通股民對整個股票市場走勢的判斷是否存在顯著性差異。在100名的專業股票分析師中,有55的人認為股票市場將上升,在150名普通股民中,有48的持相同觀點。試問,專業分析師和普通股民的觀點是否存在顯著性差異( =0.05)。解:根據題設,已知 。建立原假設 ,備選假設 根據樣本資料計算檢驗統計量的值從標準正態分布表查出=0.05時的臨界值為 。因為 ,所以不能拒絕原假設。四、正態總體方差的假設檢驗方差是反映現象在數量

32、上變異程度的指標,反映變化的均衡程度。對于正態總體方差的檢驗主要有兩種:一是檢驗總體方差是否顯著等于某一給定的確定值;二是檢驗總體方差是否顯著性地在某個給定的范圍內。在參數估計中,我們已經知道,可以用樣本方差 是總體方差 2的無偏估計。樣本方差計算公式中的( n-1)為自由度,說明樣本中有(n-1)個樣本單位的取值是可以獨立確定的,這是由于分子中 的約束使得獨立的樣本單位少了一個。所建立的原假設為 ,備選假設為 檢驗統計量為: (7.9)或者是 (7.10)在原假設成立的條件下,該統計量服從自由度為n-1 的 分布,即 (7.11)2 分布曲線全部處于第一象限,其中唯一參數是自由度。當自由度大

33、于30時,分布曲線接近于正態分布。圖7-3為 2 分布曲線的演示圖。圖7-3 2分布圖如圖中所示,有 。根據顯著性水平和自由度n-1,查 2分布表可以得到臨界值 。若檢驗統計量 ,則拒絕原假設;反之不能拒絕原假設。【例7-8】已知生產某型號的螺釘廠,在正常條件下,其螺釘長度服從正態分布 n(4.0,0.04) (單位為厘米)。現在我們對某日生產的螺釘隨機抽取6個,測得其長度為4.1,3.6,3.8,4.2,4.1,3.9,試問該日生產的螺釘總體標準差是否正常? (=0.05)解:可以計算出樣本標準差 ,該假設檢驗的過程如下:(1)建立假設: , ;(2)檢驗統計量: ;(3)臨界值:從 2分布

34、表可得到臨界值 ;(4)計算樣本統計量及其判斷。 所以,不能拒絕原假設,可以認為該日生產的螺釘總體標準差正常。五、兩個正態總體方差比的檢驗假定有兩個樣本,分別為 , ,兩樣本容量分別為 n1 和n2,且相互獨立。其中 分別為兩正態分布總體的均值和方差。又 分別為兩樣本方差,下面分兩情況對方差比 進行檢驗。 (一)兩總體均值 x 、y已知在兩總體均值已知的情況下,我們用樣本方差去估計兩總體的方差 。此時樣本方差的計算式子如下: 和 式中,兩個樣本方差的分母(自由度)都為各自的樣本容量。根據抽樣分布理論知: , ,且統計量 (7.12)即統計量 f服從f 分布。 建立假設: 。對于雙側檢驗, 。在

35、原假設成立下,檢驗統計量為: (7.13)根據顯著性水平 和自由度,查 f分布表可以得到兩個臨界值:。若樣本統計量 f滿足: ,那么就可在 概率水平下拒絕原假設。反之,如果計算的樣本統計量值在區域 之中,那么我們就不能拒絕原假設。對于左單側檢驗,建立的備選假設為 ,據以判斷的臨界值為 ,拒絕域為樣本統計量 。對于右單側檢驗,建立的備選假設為 ,據以判斷的臨界值為 ,拒絕域為樣本統計量 。(二)兩樣本均值 x 、y未知在兩總體均值未知下,我們用如下計算式子的樣本方差去估計兩總體的方差 : 和 式中, , 分別為兩樣本平均值,兩個樣本方差的分母(自由度)都為各自的樣本容量減去1。由于 , ,有統計

36、量 (7.14)從而可將其作為檢驗統計量。 建立的原假設為 ,在原假設成立的情況下,檢驗統計量 (7.15)對于雙側檢驗,備選假設為 ,當樣本統計量 或 時,拒絕原假設;反之則不能拒絕原假設。 對于左單側檢驗,備選假設為 ,據以判斷的臨界值為 ,拒絕域為樣本統計量 。對于右單側檢驗,備選假設為 ,據以判斷的臨界值為 ,拒絕域為樣本統計量 。 【例7-9】為了比較兩個地區(甲、乙)居民人均月收入不平均的差異,分別在兩個地區調查8戶和7戶的人均月收入為(假設收入都服從正態分布):試問甲區的人均月收入的不均衡性是否不大于乙區的。 解:人均月收入的不均衡性可以用方差(或者是標準差)來表征,因而問題就轉

37、化為檢驗兩地區人均月收入方差(標準差)的差異性。從調查的樣本資料中,我們可以得到 , , ,(1)建立假設: , (2)檢驗統計量: (3)臨界值:從 分布表中查得臨界值為 (4)樣本統計量的計算及判斷:所以不能拒絕原假設,即不能認為甲區的人均月收入波動較小。第三節 非參數檢驗非參數檢驗概述 2檢驗符號檢驗等級相關秩和檢驗游程檢驗 等級相關一、非參數檢驗概述前面介紹的各種假設檢驗都是在總體分布形式已知或者假定總體分布的前提下做出判斷。但在實際問題中,可能無法獲知或者不一定很了解總體的分布類型,而只能通過樣本來檢驗關于總體分布的假設。這種檢驗方法稱為非參數檢驗。非參數檢驗是相對于參數檢驗而言的,

38、是檢驗總體分布函數的統計方法。兩種檢驗方法具有共同點:都對總體的某種數量關系、特征做出假設,都建立原假設和備選假設,都是根據實際樣本統計量與臨界值的比較做出對假設的判斷。其區別在于:參數檢驗需要對總體分布做某些限制性的假定,該假定要求總體的分布類型是已知的,未知的只有分布中的某些參數是否發生變動,而且大多檢驗是建立在高斯等人的正態分布理論上。如果對總體的分布不了解或者了解很少,那么參數檢驗的結果會更加不可靠,甚至會發生很大偏差。而非參數檢驗卻不依賴于對總體分布或參數的知識,不對總體分布加以限制性的假定,亦稱為自由分布檢驗。由此可見,非參數檢驗與傳統的參數檢驗比較有一些優缺點:對檢驗的限制更少,

39、更加避免先見偏差,具有較好的穩健性;可以在更少樣本資料要求的情況下進行,在一定程度上彌補有些實際中樣本資料不足等的缺陷;可以彌補上述參數檢驗中碰到的無法運用的屬性資料問題,然而,同時也就可能損失了其中所包含的另外信息。二、 2檢驗2 檢驗是利用 2 分布的原理,通過對樣本數據進行分析來對樣本所屬的總體情況進行判斷的一種檢驗方法。在第一節中,我們也用過 2 檢驗,不過是在了解總體的分布類型的情況下來應用的。本小節中將介紹 2 檢驗在非參數檢驗中的應用,包括分布擬合檢驗和獨立性檢驗。(一)分布擬合檢驗在實際中,往往并非總是知道所研究總體的分布狀況,但卻可以得到取自于該總體的樣本。那么,就期望根據來

40、自于該總體的樣本資料信息去推斷、檢驗總體分布是否與指定分布吻合。該檢驗的假設為 , 其中 f(x)為總體的分布函數, f0(x)是某個事先假定的總體分布函數。2檢驗的步驟為:(1)建立假設: , 。(2)將樣本資料數據值按區間進行適當的劃分:分為 m個區間,各個區間的分界值為 xi,其中 ,同時應保證各個區間互不相容。(3)計算在各個樣本區間內的實際頻數 ( ),也即為樣本數值落在各個區間的樣本個數。當原假設 h0為真時,計算落在各個區間的理論概率值: ,從而計算出各個區間的理論頻率數為 npi。其中 n為樣本容量。(4)調整區間:由于該檢驗要求樣本容量 n足夠大,以及 npi不能太小。根據經

41、驗,一般要求 n50,npi>5 。如果npi5,則將npi5的樣本合并。(5)構造并計算統計量:當原假設為真時,樣本實際頻數fi應該與理論頻數npi接近,即 不應太大。根據k皮爾遜的研究,可以構造如下的檢驗統計量 (7.12)其中 k為待估計的參數個數。其余符號含義與上述同。(6)計算臨界值:在給定顯著性水平 下,查2 分布表得到臨界值 。這樣就得到拒絕原假設的值域: (7)進行判斷:如果計算的樣本統計量2 確實大于 ,那么就可以拒絕原假設,否則不能拒絕原假設。【例7-10】欲檢驗某個骰子是否均勻,可以通過檢驗各個點數的出現是否是隨機的。我們隨機投出骰子102次,將得到的點數記錄下來;

42、出現各個點數的次數見表7-3。解:記各個點數出現的次數為x ,其分布未知,依據題意我們可以對其分布建立假設,即h0:x服從均勻分布,也即 x的分布滿足 , ; h1:x不服從均勻分布。在原假設下,各個點數出現的期望頻數均為 (次)。根據(7.16)式可以得到:查表得到臨界值為 , 因而,我們不能拒絕原假設,可以認為該骰子是均勻的。(二)獨立性檢驗顧名思義,該檢驗主要是考察多個變量之間是否有關聯,如果變量之間沒有關聯性,那么就說變量之間是相互獨立的。這里的變量主要是指定類、定序資料。為了分析變量之間的關聯性,需要將資料整理成列聯表的形式。列聯表是多行多列縱橫交錯所形成的一個表體。我們以例子說明列聯表的形式以及如何將獨立性檢驗化為列聯表并進行檢驗分析的程序。【例7-11】抽樣調查某地區500名待業人員,這些人員中文化程度為高中及以上的有104人(男44人),初中的有96人(男36人),小學及以下的有300人(男140人)。問此調查結果能否說明待業人員中的文化程度與性別是相互獨立的。解:根據調查結果,我們可將數據整理成列聯表,見表7-4。列聯表中,括號內的數值為該處的期望值,其計算方法為:該格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論