正態性檢驗的一般方法匯總_第1頁
正態性檢驗的一般方法匯總_第2頁
正態性檢驗的一般方法匯總_第3頁
正態性檢驗的一般方法匯總_第4頁
正態性檢驗的一般方法匯總_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、正態性檢驗的一般方法姓名:藍何忠學號:1101200203班號:1012201正態性檢驗的一般方法【摘要】:正態分布是自然界中一種最常見的也是最重要的一種分布.因此,人們在實際使用統計分析時,總是樂于正態假定,但該假定是否成立,牽涉到正態性檢驗.在一般性的概率統計教科書中,只是把這個問題放在一般性的分布擬合下作簡短處理,而這種萬精油式的檢驗方法,對正態性檢驗不具有特效.鑒于此,該文從不同角度出發介紹正態性檢驗的幾種常見的方法,并且就各種方法作了優劣比較,【引言】一般實際獲得的數據,其分布往往未知。在數據分析中,經常要判斷一組數據的分布是否來自某一特定的分布,比如對于連續性分布,常判斷數據是否來

2、自正態分布,而對于離散分布來說,常判斷是否來自二項分布.泊松分布,或判斷實際觀測與期望數是否一致,然后才運用相應的統計方法進行分析。幾種正態性檢驗方法的比較。一、/擬合優度檢驗:(1)當總體分布未知,由樣本檢驗總體分布是否與某一理論分布一致。H0:總體X的分布歹ij為pX二為=叱i=l,2,H1:總體X的分布不為Pi.構造統計量=£半/=#上電£印仙I)芻np.其中L為樣本中/發生的實際頻數,口也為H0為真時發生的理論頻數。(2)檢驗原理若/=0,則門二口巳,意味著對于%,觀測頻數與期望頻數完全一致,即完全擬合。觀察頻數與期望頻數越接近,則產值越小。A當原假設為真時,有大數

3、定理,有與Pi不應有較大差異,即/值應較小。若/值過大,則懷疑原假設。拒絕域為R=/之王,判斷統計量是否落入拒絕域,得出結論。二、Kolmogorov-Smirnov正態性檢驗:Kolmogorov-Smirnov檢驗法是檢驗單一樣本是否來自某一特定分布。比如檢驗一組數據是否為正態分布。它的檢驗方法是以樣本數據的累積頻數分布與特定理論分布比較,若兩者間的差距很小,則推論該樣本取自某特定分布族。即對于假設檢驗問題:H0:樣本所來自的總體分布服從某特定分布H1:樣本所來自的總體分布不服從某特定分布統計原理:Fo(x)表示分布的分布函數,Fn(x)表示一組隨機樣本的累計概率函數。F2,n設D為Fo(

4、x)與Fn(x)差距的最大值,定義如下式:D=max|Fn(x)-Fo(x)對于給定的a,PDnd于a.例如:35位健康男性在未進食前的血糖濃度如表所示,試測驗這組數據是否來自均值口二80,標準差。二6的正態分布8777926880788477818080779286768081757772819084868068778776777892758078n=35檢驗過程如下:假設H0:健康成人男性血糖濃度服從正態分布H1:健康成人男性血糖濃度不服從正態分布計算過程如表:血糖濃度(X)次數(f)累計次數(F)Fn(x>Fn標準化值Z=(x-U).C理論分布F0(x)D682X0.05*1-2.

5、000.02280.0272240.11434.330.09349175260.1714-0.830.20330.02762S0.2286-0.670.251409776140.4000-0.500.30850.03783170.4857-0.330.370719806230.657100.50000.02813260.74290.170.567528842280.80000.670.74860.09862300.85/11.000.841315872320.91431.170.87900.11923351.00002.000.9772500.15710.17540.05140.01580.0

6、3530.0228結論:上表中的理論值l'o(x)是根據標準化值Z查表得到,實際上D=max|Fn(x)-Fo(x)|=0.1754<Do.55,35=°-23查D值表,故不能拒絕HO即健康成年男人血糖濃度服從正態分布,當樣本容量n大時可以用Da,n=1.36/求得結果,如上述DO.55,35=1.36/=0.2299=0.23結論:當實際觀測D>Dn,則接受Hl,反之則不拒絕H0假設。/擬合優度檢驗與K-S正態檢驗的比較:/擬合優度檢驗與K-S正態檢驗都采用實際頻數與期望頻數進行檢驗。它們之間最大的不同在于前者主要用于類別數據,而后者主要用于有計量單位的連續和定

7、量數據,擬合優度檢驗雖然也可以用于定量數據,但必須先將數據分組得到實際觀測頻數,并要求多變量之間獨立,而K-S正態檢驗法可以不分組直接把原始數據的n個觀測值進行檢驗,所以它對數據的利用較完整。三、Lilliefor正態分布檢驗該檢驗是對Kolmogorov-Smirnov檢驗的修正,當總體均值和方差未知時,Lilliefor提出用樣本均值和標準差代替總體的期望和標準差,然后使用Kolmogorov-Smirnov正態性檢驗法,它定義了一個D統計量;a人22D=maxIFn(x)-Fo(x)|參數未知,由a=S計算得到統計量,查表得Lilliefor檢驗的臨界值,確定拒絕域,得出結論。四、偏度峰

8、度檢驗法:(一)偏度檢驗:設隨機變量X具有數學期望以6R和方差/>0,”瓦為X的偏度,所謂偏度檢驗就是檢驗如下假設:“0:跖二0%:曬手。注意到,拒絕原假設”。,則可以認為樣本不是來自正態總體。接受原假設”。,并不等價于接受原假設“樣本來自正態總體:這是因為任對稱分布的偏度都為0,無法排除樣本來自非正態的對稱分布的可能。因此,偏度檢驗只能檢驗數據分布的對稱性。由于總體分布未知,無法直接得到總體的偏度,故可以利用樣本偏度作為檢驗上述假設的檢驗統計量,記i=1定義1設勺,“2,,/為隨機變量X的n個相互獨立的樣本,偏度檢驗的檢驗統計量為m(%-歹g=q32hJL12“23(2)21=1(*)

9、常被用于雙尾檢驗,因為非正態分布可能出現左偏,也可能出現右偏。在原假設成立時,瓦”0,在顯著性水平aE(0,1)下取定分位點若N旬-嚎巴則拒絕原假設。事實上,M的分布是對稱的,因此采取雙尾檢驗的做法是合理的。定理1設也為(*)式中定義的偏度檢驗統計量,貝拄伉匕漸進服從均值為0,方差為6的正態分布,即、國.N(0,6)(Nts)樣本容量有限的情形,使用漸進情形下的結論就會導致較高的出錯率,這也是偏度檢驗的一個缺陷。需要指出的是,只有在確定對稱性是唯一影響分布的形態時,偏度檢驗才是合適的選擇,否則應該避免使用偏度檢驗。(二)峰度檢驗設隨機變量X具有數學期望NCR和方差/>0,”為X的峰度,所

10、謂峰度檢驗,實際上是將正態性檢驗轉化為檢驗如下假設:盛能=33:/芋3如同偏度檢驗一樣,峰度為3的非正態分布也是存在的。所以,接受原假設”。并不能表明X一定服從正態分布,這一事實也導致對數據的正態性檢驗會有一定的出錯率。定義2設,4為隨機變量X的n個相互獨立的樣本,峰度檢驗的檢驗統計量為b2m辦歹)41 = 12 m2比(3歹)2,1 = 1(*2)定理2設為為(*2)式中定義的峰度統計量,則而(b-3)tN(0,24)九T8同偏度統計量一樣,的收斂速度也是比較慢的.五、小樣本場合(3<n<50)的W檢驗w檢驗是檢驗樣本容量nW50時,樣本是否符合正態分布的一種方法。其檢驗步驟如下

11、:將數據按數值大小重新排列,使xlWx2<Wxn;計算之區-對1=1計算式中:當n為偶數時,i=n/2;n為奇數時,i二(n1)/2;值可查表得出;計算檢驗統計量5/2£q(X廠X)t-xy/=1若w值小于判斷界限值Wa(可通過查表求得),按表上行寫明的顯著性水平a舍棄正態性假設;若W>Wa,接受正態性假設。六、大樣本場合(50<n<100)的D檢驗檢驗統計量:包-野方D=(向E(x-w再令(。-0.28209479)、歷Y=0.2998598則在顯著性水平a時,拒絕域為卜工丫的2或丫之片一哂。其中y<%/2和Y"1_哂分別為Y的a/2和1-a/2分位數。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論