




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、u 檢驗、 t 檢驗、 f 檢驗、 x2 檢驗常用顯著性檢驗1.t 檢驗適用于計量資料、 正態分布、 方差具有齊性的兩組間小樣本比較。包括配對資料間、樣本與均數間、兩樣本均數間比較三種,三者的計算公式不能混淆。2.t檢驗應用條件與 t 檢驗大致相同, 但 t檢驗用于兩組間方差不齊時,t檢驗的計算公式實際上是方差不齊時t 檢驗的校正公式。3.u 檢驗應用條件與 t 檢驗基本一致,只是當大樣本時用u 檢驗,而小樣本時則用t檢驗, t 檢驗可以代替 u 檢驗。4.方差分析用于正態分布、 方差齊性的多組間計量比較。 常見的有單因素分組的多樣本均數比較及雙因素分組的多個樣本均數的比較,方差分析首先是比較
2、各組間總的差異,如總差異有顯著性,再進行組間的兩兩比較,組間比較用q 檢驗或 lst檢驗等。5.x2 檢驗是計數資料主要的顯著性檢驗方法。用于兩個或多個百分比(率)的比較。常見以下幾種情況: 四格表資料、配對資料、多于2 行*2 列資料及組內分組 x2 檢驗。6.零反應檢驗用于計數資料。是當實驗組或對照組中出現概率為0 或 100時, x2 檢驗的一種特殊形式。屬于直接概率計算法。7.符號檢驗、秩和檢驗和ridit 檢驗三者均屬非參數統計方法,共同特點是簡便、快捷、實用。可用于各種非正態分布的資料、 未知分布資料及半定量資料的分析。其主要缺點是容易丟失數據中包含的信息。所以凡是正態分布或可通過
3、數據轉換成正態分布者盡量不用這些方法。8.hotelling 檢驗用于計量資料、正態分布、兩組間多項指標的綜合差異顯著性檢驗。計量經濟學檢驗方法討論計量經濟學中的檢驗方法多種多樣,而且在不同的假設前提之下, 使用的檢驗統計量不同,在這里我論述幾種比較常見的方法。在討論不同的檢驗之前, 我們必須知道為什么要檢驗, 到底檢驗什么?如果這個問題都不知道, 那么我覺得我們很荒謬或者說是很模式化。檢驗的含義是要確實因果關系,計量經濟學的核心是要說因果關系是怎么樣的。那么如果兩個東西之間沒有什么因果聯系, 那么我們尋找的原因就不對。 那么這樣的結果是沒有什么意義的,或者說是意義不大的。 那么檢驗對于我們確
4、認結果非常的重要,也是評價我們的結果是否擁有價值的關鍵因素。所以要做統計檢驗。t 檢驗,t 檢驗主要是檢驗單個ols 估計值或者說是參數估計值的顯著性,什么是顯著性?也就是給定一個容忍程度, 一個我們可以犯錯誤的限度, 錯誤分為兩類:1、本來是錯的但是我們認為是對的。2、本來是對的我們認為是錯的。統計的檢驗主要是針對第一種錯誤而言的。 一般的計量經濟學中的這個容忍程度是5%,也就是說可以容忍我們范第一類錯誤的概率是5%。這樣說不準確,但是比較好理解。t-stastic 是類似標準正態化的正態分布兩一樣,也就是估計值減去假設值除以估計值得標準差,一般假設值是0,這一點不難理解,如果是0 ,那么也
5、就意味著沒有因果關系。這個t-static 在經典假設之下服從t 分布。t 分布一般是和正態分布差不多, 尤其是當樣本的量足夠大的時候,一般的經驗認為在樣本數量大于 120 的時候,就可以看成是正態分布的。f-statistc :f 檢驗是屬于聯合檢驗比較重要的一種,主要的目的是用于對于一系列的原因的是否會產生結果這樣一個命題做出的檢驗。f 統計量主要的產生來源是 ssrsstsse 三個量。但是這個檢驗有一個缺點是必須在經典假設之下才能有效。lm 檢驗:這個檢驗的性質和f 檢驗的性質是一樣的,都是檢驗聯合顯著性的,不同的是 f 統計量符合 f 分布,但是 lm 統計量服從卡方分布。卡方分布是
6、正態分布的變量的平方和, 而 f 分布是卡方分布的商, 并且分子和分布必須獨立,這就是為什么 f 檢驗適用范圍受限的原因。lm=n*ssr 、或者是 lm=n-ssr 。至于其他的 white 檢驗、 brusch-pagan 檢驗(異方差的檢驗方法)、還有序列相關的 t 檢驗、 dw 檢驗基本原來是相同的。關于異方差檢驗、序列相關的檢驗其中存在不同的地方, 但是思想基本是相同的。關于異方差檢驗的討論:1、brusch-pagan 檢驗:這個檢驗的思路比較簡單,主要是要研究殘查和x 之間的關系,給定這樣的一個方程:u=b0+b1*x1+ +bn*xn+u 的回歸,其中進行 f 檢驗和 lm 檢
7、驗。如果檢驗通過那么不存在異方差,如果不通過那么存在異方差。2、white 檢驗:這個檢驗也是對異方差的檢驗,但是這個檢驗不同的是不僅對于 x 的一次方進行回歸,而且考慮到殘查和x 的平方還有 xi*xj 之間的關系。給定如下方程: u=b0+b1*y+b2*y2+u。也是用 f 和 lm 聯合檢驗來檢驗顯著性。如果通過那么不存在異方差,否則存在。序列相關的檢驗方法的討論:對于時間序列的問需要知道一個東西,也就是一介自回歸過程, 也就是一般在教科書中說到的: ar(1)過程,其中的道理主要是說在當期的變量主要是取決于過去一個時期的變量和一個隨機誤差項。表示如下:ut=p*u(t-1)+et 。
8、在這里我要說到幾個概念問題, i(1)(一階積整)、 i(0)(零階積整)。其中的一介自回歸過程 ar(1)就屬于零階積整過程, 而一階積整過程實際上是隨機游動和飄移的隨機游動過程。隨機游動過程:ut=u(t-1)+et 。也就是在 ar(1) 的過程之下,其中的p是等于 1的。 飄移的隨機游動過程: ut=a+u(t-1)+et 。 其中隨機游動過程和ar(1)過程中的不同點在于一個弱相依性的強弱問題,實際上我們在時間序列問題中,我們可以認為任何一個過程是弱相依的,但是問題的關鍵是我們不知道到底有多弱?或者更加直觀地說,我們想知道p 到底是多大,如果p 是 0.9 或者是一個比較接近于 1
9、得數,那么可能我們可以認為這個時間序列有高度持久性,這個概念表示當期的變量卻絕于一個很早的時期的變量,比如一階積整過程,實際上et 是一個獨立統分布的變量,而且條件數學期望等于0,沒有異方差性。那么實際上這個序列的數學期望是和期數沒有什么關系的。那么也就意味著從第0 期開始,u 的數學期望值就是和很久以后的u 的數學期望值一樣的。但是方差就不同了,方差隨著時間的增加不斷擴大。我們知道了, 這種不同的概念就可以討論在一階自回歸的條件之下的檢驗問題,但是我們說一介自回歸的過程是參差序列的特征而已,其他的變量的特征問題我們不談。在討論檢驗的問題以前, 我有必要交待一下時間序列在ols 估計的時候我們
10、應該注意什么。實際上解決序列自相關問題最主要的問題就是一個差分的方法。因為如果是長期持久的序列或者是不是長期持久的序列,那么一定的差分就可以解除這種問題。1、t 檢驗。如果我們知道這個變量是一個一介自回歸的過程,如果我們知道自回歸過程是 ar(1)的。那么我們就可以這樣作,首先我們做ols 估計,得到的參差序列我們認為是一階自相關的。那么為了驗證這種情況,那么我們可以做ut和 u(t-1)的回歸,當然這里可以包含一個截距項。那么我們驗證其中的參數的估計是不是顯著的,就用t 檢驗。t 檢驗與 f 檢驗有什么區別1.檢驗有單樣本 t 檢驗,配對 t 檢驗和兩樣本 t 檢驗。單樣本 t 檢驗:是用樣
11、本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。配對 t 檢驗:是采用配對設計方法觀察以下幾種情形,1,兩個同質受試對象分別接受兩種不同的處理;2,同一受試對象接受兩種不同的處理;3,同一受試對象處理前后。f 檢驗又叫方差齊性檢驗。在兩樣本t 檢驗中要用到 f 檢驗。從兩研究總體中隨機抽取樣本,要對這兩個樣本進行比較的時候, 首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用t 檢驗,若不等,可采用t檢驗或變量變換或秩和檢驗等方法。 其中要判斷兩總體方差是否相等,就可以用 f 檢驗。2.t 檢驗和方差分析的前提條件及應用誤區用于比較均值的t 檢驗
12、可以分成三類,第一類是針對單組設計定量資料的;第二類是針對配對設計定量資料的;第三類則是針對成組設計定量資料的。后兩種設計類型的區別在于事先是否將兩組研究對象按照某一個或幾個方面的特征相似配成對子。無論哪種類型的t 檢驗,都必須在滿足特定的前提條件下應用才是合理的。若是單組設計, 必須給出一個標準值或總體均值,同時,提供一組定量的觀測結果,應用 t 檢驗的前提條件就是該組資料必須服從正態分布;若是配對設計,每對數據的差值必須服從正態分布;若是成組設計, 個體之間相互獨立, 兩組資料均取自正態分布的總體,并滿足方差齊性。之所以需要這些前提條件, 是因為必須在這樣的前提下所計算出的t 統計量才服從
13、 t 分布,而 t 檢驗正是以 t 分布作為其理論依據的檢驗方法。值得注意的是,方差分析與成組設計t 檢驗的前提條件是相同的,即正態性和方差齊性。t 檢驗是目前醫學研究中使用頻率最高,醫學論文中最常見到的處理定量資料的假設檢驗方法。 t 檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現有的醫學期刊多在統計學方面作出了要求,研究結論需要統計學支持; 傳統的醫學統計教學都把 t 檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫學研究人員最熟悉的方法; t 檢驗方法簡單,其結果便于解釋。簡單、熟悉加上外界的要求,促成了 t 檢驗的流行。但是,由于某些人對該方法理解得不全面,導致在應用過程中出現
14、不少問題, 有些甚至是非常嚴重的錯誤, 直接影響到結論的可靠性。將這些問題歸類,可大致概括為以下兩種情況:不考慮 t 檢驗的應用前提,對兩組的比較一律用t 檢驗;將各種實驗設計類型一律視為多個單因素兩水平設計,多次用 t 檢驗進行均值之間的兩兩比較。以上兩種情況, 均不同程度地增加了得出錯誤結論的風險。而且,在實驗因素的個數大于等于 2 時,無法研究實驗因素之間的交互作用的大小。u 檢驗和 t 檢驗區別與聯系u 檢驗和 t 檢驗可用于樣本均數與總體均數的比較以及兩樣本均數的比較。理論上要求樣本來自正態分布總體。但在實用時,只要樣本例數n 較大,或 n 小但總體標準差已知時,就可應用u 檢驗;n
15、 小且總體標準差未知時,可應用t檢驗, 但要求樣本來自正態分布總體。 兩樣本均數比較時還要求兩總體方差相等。一、樣本均數與總體均數比較比較的目的是推斷樣本所代表的未知總體均數與已知總體均數0 有無差別。通常把理論值、標準值或經大量調查所得的穩定值作為0.根據樣本例數 n 大小和總體標準差是否已知選用 u 檢驗或 t 檢驗。(一)u 檢驗用于已知或未知但 n 足夠大 用樣本標準差 s 作為的估計值,代入式( 19.6)時。以算得的統計量 u,按表 19-3 所示關系作判斷。表 19-3 u 值、p 值與統計結論t值p 值統計結論0.05 雙側單側1.96 1.645 0.05 不拒絕 h0,差別
16、無統計學意義0.05 雙側單側 1.96 1.645 0.05 拒絕 h0,接受 h1,差別有統計學意義0.01 雙側單側 2.58 2.33 0.01 拒絕 h0,接受 h1,差別有高度統計學意義例 19.3 根據大量調查,已知健康成年男子脈搏均數為72 次/分,標準差為 6.0次/分。某醫生在山區隨機抽查25 名健康成年男子,求得其脈搏均數為74.2 次/分,能否據此認為山區成年男子的脈搏高于一般?據題意,可把大量調查所得的均數72 次/分與標準差 6.0 次/分看作為總體均數0 和總體標準差,樣本均數 x 為 74.2 次/分,樣本例數 n 為 25.h0: = 0h1: 0 =0.05
17、(單側檢驗)算得的統計量 u=1.833 1.645,p0.05,按 =0.05 檢驗水準拒絕 h0,可認為該山區健康成年男子的脈搏高于一般。(二) t 檢驗用于未知且 n 較小時。以算得的統計量 t,按表 19-4 所示關系作判斷。表 19-4 t值、 p 值與統計結論t值p 值統計結論0.05 t0.05(v) 0.05 不拒絕 h0,差別無統計學意義0.05 t0.05(v) 0.05 拒絕 h0,接受 h1,差別有統計學意義0.01 t0.01(v) 0.01 拒絕 h0,接受 h1,差別有高度統計學意義例 19.4 若例 19.3 中總體標準差未知,但樣本標準差已求出,s=6.5 次
18、/分,余數據同例 19.3.據題意,與例 19.3 不同之處在于未知,可用 t 檢驗。h0: = 0h1: 0 =0.05(單側檢驗)本例自由度 v=25-1=24 ,查 t 界值表(單側)(附表 19-1 )得 t0.05(24)=1.711.算得的統計量 t=1.692 1.711 ,p0.05,按 =0.05 檢驗水準不拒絕 h0,尚不能認為該山區成年男子的脈搏高于一般。二、配對資料的比較在醫學研究中, 常用配對設計。 配對設計主要有四種情況: 同一受試對象處理前后的數據;同一受試對象兩個部位的數據; 同一樣品用兩種方法 (儀器等)檢驗的結果; 配對的兩個受試對象分別接受兩種處理后的數據
19、。情況的目的是推斷其處理有無作用;情況、的目的是推斷兩種處理(方法等)的結果有無差別。公式( 19.8)式中,0 為差數年總體均數,因為假設處理前后或兩法無差別,則其差數的均數應為 0,d 為一組成對數據之差d(簡稱差數)的均數,其計算公式同式 (18.1 );sd 為差數均數的標準誤, sd 為差數年的標準差,計算公式同式(18.3);n 為對子數。因計算的統計量是t,按表 19-4 所示關系作判斷。例 19.5 應用某藥治療 9 例高血壓病人, 治療前后舒張壓如表19-5,試問用藥前后舒張壓有無變化?表 19-5 高血壓病人用某藥治療前后的舒張壓(kpa )病人編號治療前治療后差數 d d
20、2 1 12.8 11.7 1.0 1.21 2 13.1 13.1 0.0 0.00 3 14.9 14.4 0.5 0.25 4 14.4 13.6 0.8 0.64 5 13.6 13.1 0.5 0.25 6 13.1 13.3 -0.2 0.04 7 13.3 12.8 0.5 0.25 8 14.1 13.6 0.5 0.25 9 13.3 12.3 1.0 1.00 合計4.7 3.89 h0:該藥治療前后的舒張壓無變化,即 d=0h1:該藥治療前后的舒張壓有變化,即 d 0 =0.05自由度 v=n-1=8 , 查 t 界值表得 t0.05 (8) =2.306, t0.01
21、(8) =3.355, 本例 t=3.714t0.01(8),p0.01,按 =0.05 檢驗水準拒絕 h0,接受 h1,可認為治療前后舒張壓有變化,即該藥有降壓作用。三、完全隨機設計的兩樣本均數的比較亦稱成組比較。目的是推斷兩樣本各自代表的總體均數1 與 2 是否相等。根據樣本含量 n 的大小,分 u 檢驗與 t 檢驗。(一) u 檢驗可用于兩樣本含量n1、n2、均足夠大時,如均大于50 或 100.公式( 19.9)算得的統計量為 u 值,按表 19-3 所示關系作出判斷。例 19.6 某地抽樣調查了部分健康成人紅細胞數,其中男性 360 人, 均數為 4.660 1012/l ,標準差為
22、 0.575 1012/l ;女性 255 人,均數為 4.178 1012/l ,標準差為 0.291 1012/l ,試問該地男、女紅細胞數的均數有無差別?h0: = 0h1: 0 =0.05今 x1=4.660 1012/l ,s1=0.575 1012/l ,n1=360;x2=4.1781012/l ,s2=0.2911012/l ,n2=255.算得的 u=13.63 2.58,p0.01,按 =0.05 檢驗水準拒絕 h0,接受 h1,可認為該地男女紅細胞數的均數不同,男性高于女性。(二) t 檢驗可用于兩樣本含量n1、n2 較小時,且要求兩總體方差相等,即方差齊(homosce
23、dasticity )。若被檢驗的兩樣本方差相差較大且差別有統計學意義則需用 t 檢驗。公式( 19.10 )公式( 19.11 )公式( 19.12 )式中 sx1x2,為兩樣本均數之差的標準誤,s2c 為合并估計方差(combinedestimatevariance )。算得的統計量為 t,按表 19-4 所示關系作出判斷。例 19.7 某醫生統廣西瑤族和侗族正常婦女骨盆x 線測量資料各 50 例。骨盆入口前后徑:瑤族的均數為12.002 (cm),標準差 0.948(cm),侗族相應的為11.456 (cm)和 1.215 (cm)。問兩族婦女的骨盆入口前后徑是否有差別?h0: 1= 2
24、h1: 1 2 =0.05已知 n1=n2=50 , x1=12.002 (cm),s1=0.948 (cm);x2=11.456 (cm),s2=1.215 (cm)。本例自由度 v =n1+n2-2=98 , 查 t 界值表表內自由度一欄無98, 可用內插法(從略)或用 v =100 估計.t0.05 (100 )=1948,t0.01(100)=2.626 ,今 t=2.505t0.05(1000,p0.05,按 =0.05 檢驗水準拒絕 h0,接受 h1,可認為廣西瑤族和侗族婦女骨盆入口前后徑不同,前者大于后者。四、完全隨機設計的兩樣本幾何均數比較醫學上有些資料為等比資料或正態分布資料
25、,宜用幾何均數表示其平均水平。 比較兩樣本幾何均數的目的是推斷它們分別代表的總體幾何均數是否相等。此種情況下,應先把原始數據x 進行對數變換,用變換后的數據代入式(19.10)、(19.11)、( 19.12)計算 t 值。例 19.8 將 20 名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株或水生株作凝溶試驗,測得稀釋倍數如下,問兩組的平均效價有無差別?x1:標準株( 11 人)100,200,400,400,400,400 ,800,1600,1600 ,1600,3200x2:水生珠( 9 人)100,100,100,200,200,200,200,400,400h0: 1= 2h1:
26、 1 2 =0.05將兩組數據分別取對數,以對數作為新變量x1 和 x2.x1:2.000,2.301 ,2.602,2.602 ,2.602,2.602 ,2.903,3.204 ,3.204 ,3.204,3.505x2: 2.000,2.000 ,2.000,2.301,2.301 ,2.301,2.301 ,2.602,2.602用變換后的數據計算x1, s12;x2, s22 再代入式(19.10 )、 (19.11 ) 、 (19.12 )計算 t 值。x1=2.794 ,s12=0.2043 ;x2=2.268 ,s22=0.0554自由度 v=11+9-2=18 ,查 t 界值
27、表得 t0.01(18)=2.878 ,今 t=3.150 2.878 ,p0.01,按 =0.05 檢驗水準拒絕 h0,接受 h1,可認為兩組平均效價不同,標準株高于水生株。t 檢驗及其與方差分析的區別假設檢驗是通過兩組或多組的樣本統計量的差別或樣本統計量與總體參數的差異來推斷他們相應的總體參數是否相同。t 檢驗:1.單因素設計的小樣本( n50)計量資料2.樣本來自正態分布總體3.總體標準差未知4.兩樣本均數比較時,要求兩樣本相應的總體方差相等? 根據研究設計 t 檢驗可由三種形式:單個樣本的 t 檢驗配對樣本均數 t 檢驗(非獨立兩樣本均數 t 檢驗)兩個獨立樣本均數 t 檢驗(1)單個
28、樣本 t 檢驗? 又稱單樣本均數 t 檢驗(one sample ttest),適用于樣本均數與已知總體均數 0的比較 ,其比較目的是檢驗樣本均數所代表的總體均數 是否與已知總體均數 0有差別。? 已知總體均數 0 一般為標準值、 理論值或經大量觀察得到的較穩定的指標值。? 單樣 t 檢驗的應用條件是總體標準s 未知的小樣本資料 ( 如 n50),且服從正態分布。(2)配對樣本均數 t 檢驗? 配對樣本均數t檢驗簡稱配對t檢驗(pairedttest),又稱非獨立兩樣本均數t檢驗,適用于配對設計計量資料均數的比較,其比較目的是檢驗兩相關樣本均數所代表的未知總體均數是否有差別。? 配對設計 (p
29、aired design) 是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。? 應用配對設計可以減少實驗的誤差和控制非處理因素,提高統計處理的效率。? 配對設計處理分配方式主要有三種情況:兩個同質受試對象分別接受兩種處理,如把同窩、同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病情病人配成一對;同一受試對象或同一標本的兩個部分,隨機分配接受兩種不同處理,如例5.2資料;自身對比 (self-contrast) 。即將同一受試對象處理(實驗或治療)前后的結果進行比較,如對高血壓患者治療前后、 運動員體育運動前后的某一生理指標進行比較。(3)兩獨立樣本
30、 t 檢驗兩獨立樣本 t 檢驗(two independentsamples t-test),又稱成組t 檢驗。? 適用于完全隨機設計的兩樣本均數的比較,其目的是檢驗兩樣本所來自總體的均數是否相等。? 完全隨機設計是將受試對象隨機地分配到兩組中,每組對象分別接受不同的處理,分析比較處理的效應。或分別從不同總體中隨機抽樣進行研究。? 兩獨立樣本 t 檢驗要求兩樣本所代表的總體服從正態分布n( 1, 12)和 n( 2, 22),且兩總體方差 12、 22 相等,即方差齊性(homogeneityof variance,homoscedasticity) 。? 若兩總體方差不等 ,即方差不齊,可采
31、用t檢驗 ,或進行變量變換 ,或用秩和檢驗方法處理。t 檢驗中的注意事項1. 假設檢驗結論正確的前提作假設檢驗用的樣本資料,必須能代表相應的總體,同時各對比組具有良好的組間均衡性,才能得出有意義的統計結論和有價值的專業結論。這要求有嚴密的實驗設計和抽樣設計,如樣本是從同質總體中抽取的一個隨機樣本 ,試驗單位在干預前隨機分組,有足夠的樣本量等。2. 檢驗方法的選用及其適用條件,應根據分析目的、研究設計、資料類型、樣本量大小等選用適當的檢驗方法。t 檢驗是以正態分布為基礎的, 資料的正態性可用正態性檢驗方法檢驗予以判斷。 若資料為非正態分布, 可采用數據變換的方法,嘗試將資料變換成正態分布資料后進
32、行分析。3. 雙側檢驗與單側檢驗的選擇需根據研究目的和專業知識予以選擇。單側檢驗和雙側檢驗中的 t 值計算過程相同,只是t 界值不同,對同一資料作單側檢驗更容易獲得顯著的結果。單雙側檢驗的選擇,應在統計分析工作開始之前就決定,若缺乏這方面的依據,一般應選用雙側檢驗。4. 假設檢驗的結論不能絕對化假設檢驗統計結論的正確性是以概率作保證的,作統計結論時不能絕對化。在報告結論時,最好列出概率p 的確切數值或給出p 值的范圍,如寫成 0.02p0.05, 同時應注明采用的是單側檢驗還是雙側檢驗,以便讀者與同類研究進行比較。當p 接近臨界值時,下結論應慎重。5正確理解 p 值的統計意義p 是指在無效假設
33、h0 的總體中進行隨機抽樣 ,所觀察到的等于或大于現有統計量值的概率。其推斷的基礎是小概率事件的原理,即概率很小的事件在一次抽樣研究中幾乎是不可能發生的,如發生則拒絕h0。因此,只能說明統計學意義的“顯著” 。6假設檢驗和可信區間的關系假設檢驗用以推斷總體均數間是否相同,而可信區間則用于估計總體均數所在的范圍,兩者既有聯系又有區別。t 檢驗屬于均值分析,它是用來檢驗兩類母體均值是否相等。均值分析是來考察不同樣本之間是否存在差異, 而方差分析則是評估不同樣本之間的差異是否由某個因素起主要作用。t 檢驗: 是假設檢驗的一種常用方法,當方差未知時, 可以用來檢驗一個正態總體或兩個正態總體的均值檢驗假
34、設問題,也可以用來檢驗成對數據的均值假設問題。具體內容可以參考概率論與數理統計。可以用來判斷兩組數倨差異是否有顯著意義,也就是結果有沒有統計學意義。方差分析 :它是處理實驗研究資料時重要的分析方法之一,代表數據是否具有統計意義 , 一般一組數據代表某個條件或因素,方差分析可以判斷你選取的這個因素是否有意義,是不是影響因素如果你做統計為了找到事物相關性,而方差結果顯示數據無統計學差異,很可能代表實驗失敗或設計有問題在對均值進行假設檢驗時,一般有兩種參數檢驗方法,即t 檢驗與方差分析。 t檢驗僅用在單因素兩水平設計 (包括配對設計和成組設計)和單組設計 (給出一組數據和一個標準值的資料) 的定量資
35、料的均值檢驗場合; 而方差分析用在單因素 k 水平設計( k 3)和多因素設計的定量資料的均值檢驗場合。應當進一步說明的是,方差分析有十幾種, 不同的方差分析取決于不同的設計類型。很多人習慣于用 t 檢驗取代一切方差分析。不能用 t 檢驗取代方差分析的情況單因素 k(k 3)水平設計時的情形 。為了便于理解,舉例說明。實例研究單味中藥對小鼠細胞免疫機能的影響,把40 只小鼠隨機均分為4 組,每組 10 只,雌雄各半,用藥 15d 后測定 e-玫瑰結成率( %),結果如下,試比較各組總體均值之間的差別有無顯著性意義?對照組:14 10 12 16 13 14 12 10 13 9 黨參組:21
36、24 18 17 22 19 18 23 20 18 黃芪組:24 20 22 18 17 21 18 22 19 23 淫羊藿組:35 27 23 29 31 40 35 30 28 36 處理本例資料,通常人們錯誤的做法是,重復運用成組設計資料的t 檢驗對 4 個組的均值進行 6 次兩兩比較;而正確的做法是,先進行單因素4 水平設計資料的方差分析,若 4 個總體均值之間的差別有顯著性意義,再用q 檢驗等方法進行多個均值之間的兩兩比較。 下面將從多個方面來說明上述兩種分析方法之間的差異(表 1)。表 1 用 t 檢驗與方差分析處理 實例資料的區別比較的內容資料的利用率對原實驗設計的影響犯假陽
37、性錯誤的概率結論的可靠性t 檢驗 低: 每次僅用兩組殘:割裂了整體設計大:1- (1-0.05 ) 6 = 0.265 低:統計量的自由度小( =18)方差分析加 q 檢驗 高:每次要用全部數據全:與原實驗設計相呼應小:0.05(假定=0.05)高:統計量的自由度大( =36)注:自由度大,所對應的統計量的可靠性就高,它相當于“權重”,也類似于產生“代表”的基數,基數越大,所選出的“代表”就越具有權威性。多因素設計時的情形 。為了便于理解,仍舉例說明(表2)。表 2 注射氯化鋰或煙堿后不同時間大鼠體溫的下降值使用氯化鋰與否使用煙堿與否第二次注射后不同時間體溫下降值(攝氏度)0.7 1.5 3
38、5 - - 0.0 0.4 0.2 0.5 0.1 0.4 0.3 0.5 + - 0.7 0.5 0.1 0.5 0.1 0.6 0.2 0.5 - + 1.2 0.8 0.1 0.6 0.4 0.5 0.4 0.3 + + 1.7 0.6 0.7 0.6 0.3 0.6 0.1 0.5 顯然,表 2 中涉及到的 3 個實驗因素 (即”使用氯化鋰與否”、“使用煙堿與否”、“藥物在體內作用時間”)。這些因素之間一般都存在不同程度的交互作用,應當選用與設計類型(本例為具有一個重復測量的三因素設計)相對應的方差分析方法。然而,對于處置復雜的實驗設計問題,人們常犯的錯誤是在;其一,將多因素各水平的不
39、同組合(本例中共有 16 種不同的組合,相當于 16 種不同的實驗條件) 、簡單地看作單因素的多個水平(即視為單因素16 水平),混淆了因素與水平之間的區別,從而錯誤地確定了實驗設計類型;其二,分析資料時,常錯誤用單因素多水平設計或仍采用多次t 檢驗進行兩兩比較。誤用這兩種方法的后果是,不僅無法分析因素之間的交互作用的大小,而且,由于所選用的數學模型與設計不匹配,易得出錯誤的結論。答:t 檢驗適用于兩個變量均數間的差異檢驗,多于兩個變量間的均數比較要用方差分析。用于比較均值的t 檢驗可以分成三類,第一類是針對url=單組/url設計定量資料的; 第二類是針對配對設計定量資料的;第三類則是針對成
40、組設計定量資料的。后兩種設計類型的區別在于事先是否將兩組研究對象按照某一個或幾個方面的特征相似配成對子。無論哪種類型的t 檢驗,都必須在滿足特定的前提條件下應用才是合理的。若是單組設計,必須給出一個標準值或總體均值,同時,提供一組定量的觀測結果,應用t 檢驗的前提條件就是該組資料必須服從正態分布;若是配對設計,每對數據的差值必須服從正態分布;若是成組設計,個體之間相互獨立, 兩組資料均取自正態分布的總體,并滿足方差齊性。 之所以需要這些前提條件,是因為必須在這樣的前提下所計算出的t 統計量才服從 t 分布,而 t 檢驗正是以 t 分布作為其理論依據的檢驗方法。值得注意的是,方差分析與成組設計t
41、 檢驗的前提條件是相同的,即正態性和方差齊性。t 檢驗是目前醫學研究中使用頻率最高, 醫學論文中最常見到的處理定量資料的假設檢驗方法。 t 檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現有的醫學期刊多在統計學方面作出了要求,研究結論需要統計學支持; 傳統的醫學統計教學都把 t 檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫學研究人員最熟悉的方法; t 檢驗方法簡單,其結果便于解釋。簡單、熟悉加上外界的要求,促成了 t 檢驗的流行。但是,由于某些人對該方法理解得不全面,導致在應用過程中出現不少問題, 有些甚至是非常嚴重的錯誤,直接影響到結論的可靠性。 將這些問題歸類,可大致概括為以下兩
42、種情況:不考慮t 檢驗的應用前提,對兩組的比較一律用 t 檢驗;將各種實驗設計類型一律視為多個單因素兩水平設計,多次用 t 檢驗進行均值之間的兩兩比較。以上兩種情況,均不同程度地增加了得出錯誤結論的風險。 而且,在實驗因素的個數大于等于2 時,無法研究實驗因素之間的交互作用的大小。u 檢驗(u test)以服從 u 分布的統計量檢驗統計假設的方法。均值的檢驗。一個正態總體:當 0: 0 2 2 已知時,用檢驗統計量:其中, 0、 02 為已知正態總體的均值與方差,x 為樣本平均數, n 為樣本含量。當總體分布未知但樣本含量較大時,用檢驗統計量:兩個正態總體:h0: 12 當兩個總體方差 12、
43、 22 已知時,用檢驗統計量:當總體分布未知但樣本含量較大時,用檢驗統計量:總體率的檢驗(適用于大樣本)。一個總體: h0 : 0 用檢驗統計量:兩個總體:h0: 12 用檢驗統計量:其中,為兩樣本率的加權平均數, m1、m2 分別為兩樣本中某事件出現的頻數。u 檢驗的判斷結論:對給定的顯著性水平,查正態分布表,當0.05、 0.01 時, 臨界值分別為 1.96、2.58。當 u1.96 時,p0.05,不拒絕 h0,差異不具顯著性;當1.96u 2.58 時, p 0.05, 拒絕 h0, 差異具顯著性;當 u 2. 58 時, p 0.01,拒絕 h0,差異具高度顯著性。只要u 檢驗的條
44、件滿足,如正態總體 02 已知或是大樣本,都可使用該方法, 如某一運動隊通過一段時間的訓練后成績是否有所提高,可以進行 u 檢驗。皮爾遜 x2 檢驗和卡方檢驗一樣嗎?皮爾遜x2 檢驗是檢驗實際頻數和理論頻數是否較為接近,統計學家卡爾?皮爾遜 1900 年提出了如下檢驗統計量:x2=【(實際頻數 -理論頻數的) 2】/理論頻數 它近似服從自由度為v =組格數估計參數個數 1 的 分布。式中,n 是樣本量,理論頻數是由樣本量乘以由理論分布確定的組格概率計算的。求和項數為組格數目。皮爾遜 統計量的直觀意義十分顯然:是各組格的實際觀測頻數與理論期望頻數的相對平方偏差的總和,若值充分大,則應認為樣本提供
45、了理論分布與統計分布不同的顯著證據,即假設的總體分布與總體的實際分布不符,從而應否定所假定的理論分布。所以,應當在 分布密度曲線圖的右尾部建立拒絕域。卡方檢驗有很多種, 跟他們叫卡方檢驗是因為構造的統計量服從或近似服從卡方分布,然后再根據卡方分布建立檢驗規則,比如檢驗正態總體方差的是否為某定值的卡方檢驗構造的統計量是那樣的這個統計量服從 n-1 的卡方分布,所以這個檢驗也叫卡方檢驗。t 檢驗(t test)什么是 t 檢驗t 檢驗是用于小樣本(樣本容量小于30)的兩個平均值差異程度的檢驗方法。它是用 t 分布理論來推斷差異發生的概率,從而判定兩個平均數的差異是否顯著。t 檢驗是戈斯特為了觀測釀
46、酒質量而發明的。戈斯特在位于都柏林的健力士釀酒廠擔任統計學家,基于claude guinness 聘用從牛津大學和劍橋大學出來的最好的畢業生以將生物化學及統計學應用到健力士工業程序的創新政策。戈特特于 1908 年在 biometrika 上公布 t 檢驗, 但因其老板認為其為商業機密而被迫使用筆名(學生)。實際上,戈斯特的真實身份不只是其它統計學家不知道,連其老板也不知道。t 檢驗的步驟1、 建立虛無假設 h0: 1= 2, 即先假定兩個總體平均數之間沒有顯著差異;2、計算統計量 t 值,對于不同類型的問題選用不同的統計量計算方法;1)如果要評斷一個總體中的小樣本平均數與總體平均值之間的差異
47、程度,其統計量 t 值的計算公式為:2)如果要評斷兩組樣本平均數之間的差異程度,其統計量t 值的計算公式為:3、根據自由度 df=n-1,查 t 值表,找出規定的 t 理論值并進行比較。理論值差異的顯著水平為0.01 級或 0.05 級。不同自由度的顯著水平理論值記為t(df)0.01 和 t(df)0.054、比較計算得到的 t 值和理論 t 值,推斷發生的概率,依據下表給出的t值與差異顯著性關系表作出判斷。t 值與差異顯著性關系表tp 值差異顯著程度t 0.05 差異非常顯著差異顯著差異不顯著5、根據是以上分析,結合具體情況,作出結論。t 檢驗舉例說明例如,t 檢驗可用于比較藥物治療組與安
48、慰劑治療組病人的測量差別。理論上,即使樣本量很小時,也可以進行t 檢驗。(如樣本量為10,一些學者聲稱甚至更小的樣本也行),只要每組中變量呈正態分布,兩組方差不會明顯不同。如上所述,可以通過觀察數據的分布或進行正態性檢驗估計數據的正態假設。方差齊性的假設可進行f 檢驗,或進行更有效的levenes 檢驗。如果不滿足這些條件,只好使用非參數檢驗代替t 檢驗進行兩組間均值的比較。t 檢驗中的 p 值是接受兩均值存在差異這個假設可能犯錯的概率。在統計學上,當兩組觀察對象總體中的確不存在差別時,這個概率與我們拒絕了該假設有關。一些學者認為如果差異具有特定的方向性,我們只要考慮單側概率分布,將所得到 t
49、-檢驗的 p 值分為兩半。另一些學者則認為無論何種情況下都要報告標準的雙側 t 檢驗概率。1、數據的排列為了進行獨立樣本t 檢驗,需要一個自(分組)變量(如性別:男女)與一個因變量(如測量值)。根據自變量的特定值,比較各組中因變量的均值。用t 檢驗比較下列男、女兒童身高的均值。性別身高對象 1 對象 2 對象 3 對象 4 對象 5男性男性男性女性女性111 110 109 102 104男性身高均數= 110 女性身高均數= 103t 統計量 (t-statistic) 和 t 檢驗(t-test)是一回事嗎?如何不是,它們之間有什么關系?相關,但不是一件事。 t-test 是指用 t-st
50、atistic 來做假設檢驗(hypothesistesting), 而 t-statistic 是根據 model 計算的, 用來做檢驗的統計量。正常 t-statistic 應該在 0 假設(null hypothesis) 為真時,服從 t 分布(t-distribution) 。t-test 時根據 t-statistic 值的大小計算 p-value ,決定是接受還是拒絕假設。參數估計和假設估計的區別和聯系參數估計 :指的是用樣本中的數據估計總體分布的某個或某幾個參數,比如給定一定樣本容量的樣本,要求估計總體的均值、方差等。假設檢驗 :通過樣本分布,檢驗某個參數的屬于某個區間范圍的概
51、率。參數估計分兩種: 一種是點估計,另一種是區間估計。其中,區間估計與假設檢驗可以看作同一個問題的不同表述方式。統計學方法包括描述統計和推斷統計兩種方法,其中,推斷統計又包括參數估計和假設檢驗。1.參數估計就是用樣本統計量去估計總體的參數,它的方法有點估計和區間估計兩種。點估計是用估計量的某個取值直接作為總體參數的估計值。點估計的缺陷是沒法給出估計的可靠性,也沒法說出點估計值與總體參數真實值接近的程度。區間估計是在點估計的基礎上給出總體參數估計的一個估計區間,該區間通常是由樣本統計量加減估計誤差得到的。在區間估計中, 由樣本估計量構造出的總體參數在一定置信水平下的估計區間稱為置信區間。統計學家
52、在某種程度上確信這個區間會包含真正的總體參數。在區間統計中置信度越高,置信區間越大。置信水平為1-a, a 為小概率事件或者不可能事件,常用的置信水平值為99%,95%,90% ,對應的 a 為0.01, 0.05, 0.1置信區間是一個隨機區間, 它會因樣本的不同而變化, 而且不是所有的區間都包含總體參數。一個總體參數的區間估計需要考慮總體是否為正態分布,總體方差是否已知, 用于估計的樣本是大樣本還是小樣本等(1) 來自正態分布的樣本均值, 不論抽取的是大樣本還是小樣本,均服從正態分布(2) 總體不是正態分布, 大樣本的樣本均值服從正態分布,小樣本的服從 t 分布(3) 不論已判斷是正態分布
53、還是t 分布,如果總體方差未知時,都按t 分布來處理(4) t 分布要比標準正態分布平坦,那么要比標準正態分布離散,隨著自由度的增大越接近(5) 樣本均數服從的正態分布為n(u a2/n)遠遠小于原變量離散程度n (u a2)2. 假設檢驗是推斷統計的另一項重要內容,它與參數估計類似,但角度不同,參數估計是利用樣本信息推斷未知的總體參數,而假設檢驗則是先對總體參數提出一個假設值,然后利用樣本信息判斷這一假設是否成立。檢驗的基本思想:先提出假設,然后根據資料的特點,計算相應的統計量,來判斷假設是否成立, 如果成立的可能性是一個小概率的話,就拒絕該假設, 因此稱小概率的反證法。 最重要的是看能否通
54、過得到的概率去推翻原定的假設,而不是去證實它統計學中假設檢驗的基本步驟:(1)建立假設,確定檢驗水準假設有零假設( h0)和備擇假設( h1)兩個,零假設又叫作無效假設或檢驗假設。h0 和 h1 的關系是互相對立的,如果拒絕h0,就要接受 h1,根據備擇假設不同,假設檢驗有單、 雙側檢驗兩種。 檢驗水準用表示,通常取 0.05 或 0.10,檢驗水準說明了該檢驗犯第一類錯誤的概率。(2)根據研究目的和設計類型選擇適合的檢驗方法這里的檢驗方法,是指參數檢驗方法,有u 檢驗、 t 檢驗和方差分析三種,對應于不同的檢驗公式。(3)確定 p 值并作出統計結論u 檢驗得到的是 u 統計量或稱 u 值,t
55、 檢驗得到的是 t 統計量或稱 t 值。方差分析得到的是 f 統計量或稱 f 值。將求得的統計量絕對值與界值相比,可以確定p值。當0.05 時,u 值要和 u 界值 1.96 相比較,確定 p 值。如果 u1.96,則p0.05.反之,如 u1.96,則 p0.05.t 值要和某自由度的t 界值相比較, 確定p 值。如果 t 值t 界值,故 p0.05.反之,如 tt 界值,則 p0.05。相同自由度的情況下,單側檢驗的t 界值要小于雙側檢驗的t 界值,因此有可能出現算得的 t 值大于單側 t 界值,而小于雙側 t 界值的情況,即單側檢驗顯著,雙側檢驗未必就顯著,反之,雙側檢驗顯著,單側檢驗必
56、然會顯著。即單側檢驗更容易出現陽性結論。當p0.05 時,接受零假設,認為差異無統計學意義,或者說二者不存在質的區別。當p0.05 時,拒絕零假設,接受備擇假設,認為差異有統計學意義,也可以理解為二者存在質的區別。但即使檢驗結果是p0.01甚至 p0.001 ,都不說明差異相差很大,只表示更有把握認為二者存在差異。3 參數估計與假設檢驗之間的聯系與區別:(1) 主要聯系:a、都是根據樣本信息推斷總體參數;b、都以抽樣分布為理論依據,建立在概率論基礎之上的推斷;c、二者可相互轉換,形成對偶性。(2) 主要區別:a、參數估計是以樣本資料估計總體參數的真值,假設檢驗是以樣本資料檢驗對總體參數的先驗假
57、設是否成立;b、區間估計求得的是求以樣本估計值為中心的雙側置信區間,假設檢驗既有雙側檢驗,也有單側檢驗;c、區間估計立足于大概率,假設檢驗立足于小概率。區間估計:1、單個正態總體均值的區間估計:法 1:打開數據文件: descriotivestatistics explore:dsplay 中選 statistics ,在 dependentlist 中輸入所求的變量名statistics 對話框中選擇 descriptives ,并在 confidenceinterval for means 中輸入數值, 作為置信度 .得統計量描述表中 lower bound 為置信區間的下限 , uppe
58、r bound 為置信區間的上限法 2:利用單個樣本 t 檢驗過程求均值的置信區間comparemeans one_samplet test,在 test variables 中輸入所求的變量名,在test value中輸入所假設的均值,打開option 對話框中 confidenceinterval 輸入置信度 . 2、兩個正態總體均值的區間估計:打開數據文件: comparemeans independent_samplet test, 在test variables 中輸入所求的變量名,在groupingvariabli 中輸入兩個正態總體變量名,打開 define groups 對話框
59、,在 group 1 中輸入第一個正態總體變量名, group 2 中輸入第二個正態總體變量名,打開option 對話框中confidenceinterval 輸入置信度 . 得兩個獨立樣本在方差齊和方差不齊兩種情況下均值差的置信區間三、假設檢驗:1、單個正態總體均值的假設檢驗打開數據文件:comparemeans one_samplet test,在 test variables 中輸入所求的變量名,在test value 中輸入總體的均值,打開option 對話框中confidenceinterval 輸入置信度( 1-a)missing values 中選擇缺失值的處理方式:exclud
60、ecases analysis by analysis :在需要分析的數據中剔除含有缺失值的個案excludecases:刪除所有數據中含有缺失值的個案數據統計量表中列出:n 變量的數據個數; mean 均值; std.deviation標準離差 ;std.errormean 均值的標準誤差 ; 成果表中列出:test vaule 檢驗值; t t 值;df 自由度; sig.(2_tailed)雙尾顯著性概率;mean difference均值差;confidenceinterval of mean difference均值差的置信區間 ; 當顯著性概率大于a,認為樣本的均值與總體的均值沒有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業廢棄物處理的物聯網解決方案
- 工業旅游的規劃與實施
- 工業機器人系統的集成與優化
- 工業機器人技術進展及影響
- 工業生態化改造與實踐案例分析
- 工業能源管理與自動化控制技術
- 工業設備智能化升級解決方案
- 工業自動化中的語音控制技術應用
- 工業設計中的師徒智慧-產品設計專業成長
- 工作與生活平衡與員工福利設計
- 2025年特種設備安全考試題庫特種設備安全管理人員法規應用試卷
- 普法試題及答案初中
- 中控崗位考試題及答案
- 商鋪退押金協議書
- 碘對比劑護理應用與安全管理
- 2025-2030年中國航空密封件行業市場現狀供需分析及投資評估規劃分析研究報告
- 知識產權租賃協議書
- GB 45673-2025危險化學品企業安全生產標準化通用規范
- 醫院培訓課件:《新生兒早期基本保健專家共識(2020)解讀》
- 山東開放大學招聘真題2024
- 《治療癲癇藥物》課件
評論
0/150
提交評論