




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十章 卡方檢驗李金德思考:n例例1:隨機抽取:隨機抽取60名學生,詢問他們在高中名學生,詢問他們在高中是否需要文理分科,贊成分科的是否需要文理分科,贊成分科的39人,反人,反對分科的對分科的21人,問他們對分科的意見是否人,問他們對分科的意見是否有顯著差異?有顯著差異?n39大于大于21,所以學校決定不要分科。這樣,所以學校決定不要分科。這樣做可以嗎?做可以嗎?例例2:例某企業生產三種類型的手機:例某企業生產三種類型的手機:A類型、類型、B類類型、型、C類型。在一次市場調查中,公司市場研究小類型。在一次市場調查中,公司市場研究小組提出了男女使用者對于三種手機類型偏好是否組提出了男女使用者對于
2、三種手機類型偏好是否有差異的問題。有差異的問題。有的人因此用有的人因此用t檢驗檢驗兩者的差異,這樣做行嗎?檢驗檢驗兩者的差異,這樣做行嗎? A B C 男 20 40 20 女 30 30 10第一節 檢驗的原理一、一、 檢驗的假設檢驗的假設(一)(一)分類分類相互排斥,互不包容相互排斥,互不包容 檢驗中的分類必須相互排斥,這樣每一個觀測值就會被劃分到一個類別或另一個類別之中。此外,分類必須互不包容,這樣,就不會出現某一觀測值同時劃分到更多的類別當中去的情況。222(二)(二)觀測值觀測值相互獨立相互獨立 各個被試的觀測值之間彼此獨立,這是最基本的一個假定,如一個被試對某一品牌的選擇對另一個被
3、試的選擇沒有影響。當同一被試被劃分到一個以上的類別中時,常常會違反這個假定。 注意:當討論列聯表時,獨立性假定是指變量之間的相互獨立。這種情況下,這種變量的獨立性正在被檢測。而觀測值的獨立性則是預先的一個假定。(三)(三)期望次數期望次數的大小有規定的大小有規定 為了努力使 分布成為 值合理準確的近似估計,每一個單元格中的期望次數應該至少在5以上。一些更加謹慎的統計學家提出了更嚴格的標準,當自由度等于1時,在進行 檢驗時,每一個單元格的期望次數至少不應低于10,這樣才能保證檢驗的準確性。222 另外,在許多分類研究中會存在這樣一種情況,如自由度很大自由度很大,有幾個類別的理論次數雖然很小,理論
4、次數雖然很小,但在給以接受的標準范圍內,只有一個類別的理但在給以接受的標準范圍內,只有一個類別的理論次數低于論次數低于1。此時,一個簡單的處理原則是設法使每一個類別的理論次數都不要低于1,分類中不超過20%的類別的理論次數可以小于5。 在理論次數較小的特殊的四格表理論次數較小的特殊的四格表中,應運用一個精確的多項檢驗來避免使用近似的 檢驗。2 二、 檢驗的類別(一)配合度檢驗(一)配合度檢驗 配合度檢驗主要用來檢驗一個因素多項分類一個因素多項分類的實際觀察數與某理論次數是否接近的實際觀察數與某理論次數是否接近。 這種 檢驗方法有時也稱為無差假說檢驗無差假說檢驗。當對連續數據的正態性進行檢驗時,
5、這種檢驗又可稱為正態吻合性檢驗。22 (二)獨立性檢驗(二)獨立性檢驗 獨立性檢驗是用來檢驗兩個或兩個以上因素兩個或兩個以上因素各種分類之間是否有關聯或是否具有獨立性各種分類之間是否有關聯或是否具有獨立性的問題。這種類型的 檢驗適用于探討兩個變量之間是否具有關聯(非獨立)或無關(獨立),如果再加入另一個變量的影響,即探討三個變量之間關系時,就必須使用多維列聯表分析方法。2 (三)同質性檢驗(三)同質性檢驗 同質性檢驗的主要目的在于檢定不同人群母不同人群母總體在某一個變量的反應是否具有顯著差異總體在某一個變量的反應是否具有顯著差異。 當用同質性檢驗檢測雙樣本在單一變量的分布情 形,如果兩樣本沒有
6、差異,就可以說兩個母總體是同質的,反之,則說這兩個母總體是異質的。 三、 檢驗的基本公式 檢驗的統計原理,是比較觀察值與理論值的差別: 1.如果兩者的差異越小,檢驗的結果越不容易達到顯著性水平; 2.兩者的差異越大,檢驗的結果越可能達到顯著性水平,就可以下結論拒絕虛無假設而接受備擇假設。22 基本公式如下: 其中 表示實際觀察次數, 表示某理論次數。 要求: 5eefff2020fefef 四、小期望次數的連續性校正 運用 檢驗時,有一個特殊的要求,單元格的理論次數不得小于5,小于5時可能違反統計基本假設,導致統計檢驗高估的情形出現。通常需要有80%以上的單元格理論值要大于5,否則 檢驗的結果
7、偏差非常明顯。22n當單元格的人數過少時,處理的方法有四種:1.單元格合并法2.增加樣本數3.去除樣本法4.使用校正公式第二節 配合度檢驗 配合度檢驗(goodness of fit test)主要用于檢驗單一變量的實際觀察次數分布與某理論次數檢驗單一變量的實際觀察次數分布與某理論次數是否有差別是否有差別。由于它檢驗的內容僅涉及一個因素多項分類的計數資料,故可以說是一種單因素檢驗(One-way test)。 一、配合度檢驗的一般問題(一)統計假設(一)統計假設 統計假設如下統計假設如下:ffffHffffHeeoee010000:0:或或fffee202)(基本公式:基本公式: (二)自由度
8、的確定(二)自由度的確定 自由度確定的一般原則是:以相互獨立的類別數k(或C)減去所受的限制數,即Mkdf在各種適合性檢驗中,如果理論次數只受到總和的限制,即受 的限制,則自由度為 eff01 kdf在正態分布的適合性檢驗,受到三個條件的限制,其自由度為 3 kdf (三)理論次數的計算規則(三)理論次數的計算規則 數據分布以其理論概率為依據,這時的理論次數等于總次數乘以某種屬性出現的概率,即 理論次數的計算,一般是根據某種理論,按一定的概率通過樣本即實際觀察次數計算。某種理論有經驗概率,也有理論概率,如二項分布、正態分布等。Npfe 二、配合度檢驗的應用(一)檢驗無差假說(一)檢驗無差假說
9、無差假說,是指各項分類的實計數之間沒有差異,也就是假設各項分類之間的機會相等,或概率相等,因此理論次數完全按概率相等的條件計算。即: 理論次數=總數分類項數1 例10-1:隨機抽取60名學生,詢問他們在高中是否需要文理分科,贊成分科的39人,反對分科的21人,問他們對分科的意見是否有顯著差異?(p298) n解:此題只有兩項分類。假設兩項分類的實計數相等或無差別,其各項實計數的概率應相同,即p=q=0.5。因此,檢驗的問題“對分科的意見是否有顯著差異”實際上是指每種態度的實計數與理論次數差異是否顯著,因各項的理論次數項數相同,故可理解為對分科的態度是否一樣或是否有差異。故:1122604 .5
10、30)9(930)3021(30)3039()(2)3022222020100dfffffffHffHeeeee所以為一個統計量,分類項數時用到總數因為計算計算統計量:1)建立假設302160ef3)統計決策之間。至論犯錯誤的概率在有顯著差異,做這一結度們對高中文理分科的態答:可以推論說,學生或值在兩者之間,所以,算得,時,值表,當查01. 005. 005. 001. 063. 684. 31201. 02205. 02201. 0205. 02pdf 例10-2:某項民意測驗,答案有同意、不置可否、不同意三種。調查了48人,結果同意的24人,不置可否的12人,不同意的12人。問持這三種意見
11、的人數是否有顯著不同?(p299) 解:解:此題為檢驗無差假說,已知分類的項數為三,故各此題為檢驗無差假說,已知分類的項數為三,故各項分類假設實計數相等。所以項分類假設實計數相等。所以 1)建立假設)建立假設 2)計算統計量)計算統計量 3)進行統計決策)進行統計決策 查表,當 時 , 因為 ,所以 。達到顯著性水平,拒絕原假設。說明三種態度有顯著差異。163148,48,31feNpffHe00:ffHe01:616)1612(16)1612(16)1624(2222213df99. 5205. 0205. 02605. 0p (二)檢驗假設分布的概率(二)檢驗假設分布的概率 假設某因素各項
12、分類的次數分布為正態,檢驗實計數與理論上期望的結果之間是否有差異。因為已假定所觀察的資料是按正態分布的,故其理論次數的計算應按正態分布概率,分別計算各項分類的理論次數。 具體方法是先按正態分布理論計算各項分類應先按正態分布理論計算各項分類應有的概率再乘以總數有的概率再乘以總數,便得到各項分類的理論次理論次數數。 如果不是事先假定所觀察的資料為正態分布如果不是事先假定所觀察的資料為正態分布而是其他分布,如二項分布、泊松分布等,其概而是其他分布,如二項分布、泊松分布等,其概率應按各所假定的分布計算。率應按各所假定的分布計算。事先假定的分布不事先假定的分布不是理論分布而是經驗分布,是理論分布而是經驗
13、分布,亦可按此經驗分布計亦可按此經驗分布計算概率,在乘以總數便可得到理論次數,從而進算概率,在乘以總數便可得到理論次數,從而進一步檢驗假設分布與實計數的分布之間,亦即實一步檢驗假設分布與實計數的分布之間,亦即實計數與理論次數之間差異是否顯著。計數與理論次數之間差異是否顯著。 例10-3:某班有學生50人,體檢結果按一定標準劃分為甲乙丙三類,其中甲類16人,乙類24人,丙類10人,問該班學生的身體狀況是否符合正態分布?(299) 解:該題中的理論次數應按假設的正態分布概率計算。按正態分布,就可以認為 包括了全體,各等級所占的橫坐標應該相同( ),故各類人數應占的比率為:1587. 03413.
14、050. 0316826. 023413. 0111587. 03413. 050. 013之間,曲線下的面積為丙級:之間,曲線下的面積為乙級:之間,曲線下的面積為甲級:3236為多個值)因建立假設以總人數。各部分理論上的概率乘各等級的理論次數應為丙乙甲ffffHffeeiieeef,(:)18501587. 034506826. 08501587. 0000ffHeii01: 答:可以說該班學生的身體狀態不符合正態分布,或者說該班學生身體狀況甲乙丙三類的人數分布與正態分布有顯著差異。,差異顯著表得查)統計決策)()()(值用基本公式計算205. 02205. 02222226 .102133
15、44.1188103434248816df2)計算統計量 例10-4:根據以往的經驗,某校長認為高中生升學的男女比例為2 :1,今年的升學情況是男生85人,女生35人,問今年升學的男女比例是否符合該校長的經驗?(p300) 解:此題是假設男女生升學的人數分布與校長的經驗分布相同,故理論次數應按經驗分布的概率計算。 理論次數為:1)建立假設 H0:男女升學比例符合校長經驗 H1:男女升學比例不符合校長經驗403135858032)3585()(女男ffee的經驗沒有顯著差異。生人數分布與某校長答:實際升學的男女學差異不顯著故表得的查)統計決策)()()計算統計量,84. 312394. 0404
16、0-358080-852205. 02205. 02222df 三、連續變量分布的吻合性檢驗三、連續變量分布的吻合性檢驗(自學自學)復習n1、什么是、什么是 檢驗檢驗n2、 檢驗的步驟檢驗的步驟n3、 檢驗的類別(第二節)檢驗的類別(第二節)222 目的目的: 實際觀察實際觀察頻數頻數分布與理論分布與理論頻數頻數分布是否相分布是否相一致,或者說有無顯著差異問題。包括:一致,或者說有無顯著差異問題。包括: 一個因素的多個分類一個因素的多個分類 多個因素的多個分類多個因素的多個分類 檢驗統計量檢驗統計量:2 應用應用:計數數據:計數數據返回步驟(1) 建立檢驗假設建立檢驗假設 H0:fe-f0=0
17、 H1 :fe-f00(2)求檢驗統計量值)求檢驗統計量值(4)確定臨界值,進行統計決策)確定臨界值,進行統計決策返回202eefff(3) 確定自由度,顯著性水平確定自由度,顯著性水平=0.05 2如果如果20.05(df),則拒絕,則拒絕H0 配合度檢驗:配合度檢驗:n擬合優度檢驗,重點考察一個觀測次數分布(實擬合優度檢驗,重點考察一個觀測次數分布(實際頻數)與理論預測次數分布(理論頻數)之間際頻數)與理論預測次數分布(理論頻數)之間的差異。的差異。n適用于研究某總體的分布是否與某種分布相符合。適用于研究某總體的分布是否與某種分布相符合。n如:如:課堂練習課堂練習例例 某企業生產三種類型的
18、手機某企業生產三種類型的手機:A類型、類型、B類型、類型、C類型。在一次市場調查中,公司市場研究小組提類型。在一次市場調查中,公司市場研究小組提出了男女使用者對于三種手機類型偏好是否有差出了男女使用者對于三種手機類型偏好是否有差異的問題。異的問題。 A B C 男 20 40 20 女 30 30 10n問題:問題: 手機偏好與使用者性別是否有關聯?手機偏好與使用者性別是否有關聯?兩個因素兩個因素是否關聯是否關聯第三節第三節 獨立性檢驗 教學內容n一、獨立性檢驗的一般問題與步驟一、獨立性檢驗的一般問題與步驟n1、幾個重要概念、幾個重要概念n2、獨立性檢驗的內涵、獨立性檢驗的內涵n3、獨立性檢驗
19、的步驟、獨立性檢驗的步驟n四、獨立性檢驗的兩種類別四、獨立性檢驗的兩種類別四格表獨立性檢驗四格表獨立性檢驗列聯表獨立性檢驗列聯表獨立性檢驗n五、五、列聯表獨立性檢驗列聯表獨立性檢驗一、幾個重要概念一、幾個重要概念n1、列聯表、列聯表定義:呈現兩個變量之間關系的表格定義:呈現兩個變量之間關系的表格記錄兩個變量不同水平的各種組合的被試頻數記錄兩個變量不同水平的各種組合的被試頻數n2、觀測頻數、觀測頻數實際觀測到的頻次實際觀測到的頻次n3、期望頻數、期望頻數假設兩個變量之間沒有任何聯系的情況下,我假設兩個變量之間沒有任何聯系的情況下,我們所預期的各種變量組合應有的頻次們所預期的各種變量組合應有的頻次
20、n4、邊緣值、邊緣值列聯表中每一行和每一列的觀測頻數的總和列聯表中每一行和每一列的觀測頻數的總和返回返回橫標目橫標目縱標目縱標目表示變量表示變量X的的r種水種水平平表示變量表示變量Y的的c種水平種水平3 2列聯表列聯表單元單元有有20名被試在性別變量名被試在性別變量上是上是“男性男性”,在偏愛的,在偏愛的手機上是手機上是“A類型類型”返回返回 A B C 男 20 40 20 女 30 30 10計算期望次數計算期望次數如果性別與偏好無如果性別與偏好無關關,說明表中說明表中150個個被試被試,8/15是男是男性性,7/15是女性是女性,則則喜愛喜愛A類型的類型的50人人中中,有有8/15是男是
21、男性性,7/15是女性是女性邊緣值邊緣值邊緣值邊緣值Nffjifyixie樣本容量列之和第行之和第nfe1=(5080)/150= 26.67nfe2 =(7080)/150= 37.3nfe3 =(3080)/150= 16nfe4 =(5070)/150= 23.33nfe5=(7070)/150= 32.7nfe6 =(3070)/150= 14 返回返回二、獨立性檢驗的內涵二、獨立性檢驗的內涵n獨立性檢驗表示獨立性檢驗表示對于對于x的每個值的每個值,y值的次值的次數分布是否有差異。數分布是否有差異。n如果對于如果對于x的的 每個值,每個值,y值的次數分布一樣,值的次數分布一樣,則表示:
22、則表示:x變量和變量和y變量毫無關系。變量毫無關系。n如果對于如果對于x的的 每個值,每個值,y值的次數分布有差異,值的次數分布有差異,則表示:則表示:x變量和變量和y變量有關聯,或說兩變量變量有關聯,或說兩變量存在相關。存在相關。n所以,獨立性檢驗也是對兩個變量之間相關程所以,獨立性檢驗也是對兩個變量之間相關程度的一種檢驗。度的一種檢驗。n如果性別與手機類型偏好之間無聯系,則表示如果性別與手機類型偏好之間無聯系,則表示不論男女,對這些手機都具有一致的偏好。不論男女,對這些手機都具有一致的偏好。那那么,每個觀測頻次就應該與相應的期望頻次相么,每個觀測頻次就應該與相應的期望頻次相同,這時卡方值為
23、同,這時卡方值為0。n如果性別與手機類型偏好之間聯系越緊密,則如果性別與手機類型偏好之間聯系越緊密,則表示較多的男性喜歡某種類型,而較多的女性表示較多的男性喜歡某種類型,而較多的女性喜歡其他類別的手機。則觀測頻次與相應的期喜歡其他類別的手機。則觀測頻次與相應的期望頻次的差異越大。望頻次的差異越大。n兩個變量之間聯系越緊密,觀測頻次與相應期兩個變量之間聯系越緊密,觀測頻次與相應期望頻次的差異就越大,這時卡方值就越大。望頻次的差異就越大,這時卡方值就越大。返回返回例例 某企業生產三種類型的手機某企業生產三種類型的手機:A類型、類型、B類型、類型、C類型。在一次市場調查中,公司市場研究小組提類型。在
24、一次市場調查中,公司市場研究小組提出了男女使用者對于三種手機類型偏好是否有差出了男女使用者對于三種手機類型偏好是否有差異的問題。異的問題。 A B C 男 20 40 20 女 30 30 10三、獨立性檢驗的步驟三、獨立性檢驗的步驟1、假設、假設H0:因素一與因素二無關聯因素一與因素二無關聯H1:因素一與因素二有關聯因素一與因素二有關聯2、計算、計算3、確定自由度,、確定自由度,顯著性水平顯著性水平 df=(R-1)()(C-1)4、確定臨界值,進行決策、確定臨界值,進行決策2返回返回202eefff,則拒絕,則拒絕H0如果如果22(df) 1(22fffyixioiN或四、四格表獨立性檢驗
25、四、四格表獨立性檢驗 2 2表表 檢驗檢驗2(一)兩獨立樣本四格表卡方檢驗(一)兩獨立樣本四格表卡方檢驗(二)兩相關樣本四格表卡方檢驗(二)兩相關樣本四格表卡方檢驗n1、四格表、四格表n2、檢驗步驟、檢驗步驟n3、卡方的連續性矯正、卡方的連續性矯正 四格表資料的基本形式四格表資料的基本形式 邊緣值邊緣值單元單元四格表資料檢驗的專用公式四格表資料檢驗的專用公式返回DBCADCBABCADN22例例10-7:隨機抽取:隨機抽取90人,按不同性別分類,將學人,按不同性別分類,將學生成績分為中等以上及中等以下兩類。問男女生成績分為中等以上及中等以下兩類。問男女在學業水平上是否有關聯?在學業水平上是否有
26、關聯?(p312) 23(A) 17(B) 28(C) 22(D)學業水平學業水平中等以上中等以上中等以下中等以下性別性別男男女女n解:解:1)建立假設 H0 :性別與學業成績無關:性別與學業成績無關 H1 :性別與學業成績有關:性別與學業成績有關 2) 計算統計量020. 090395150402817222322當df=1時,84. 3205. 0205. 02所以,性別與學業成績無關。所以,性別與學業成績無關。3)比較與決策 異。學業成績上沒有顯著差同在關,或說男女生性別不答:性別與學業成績無時,表,當查論次數。基本公式計算各格的理用05. 0101996. 067.2133.2833.
27、1767.2267.2133.173933.1767.224033.2867.225167.22905140222222224321267.212233.282833.171767.2223dfffffeeee3 3 四格表資料檢驗的校正公式四格表資料檢驗的校正公式 n當四格表任一格的理論次數小于5時,要采用卡方值連續校正公式DBCADCBANBCADN222 練習練習:今對一廣告的態度調查,隨機抽20名被試對該廣告進行評價。試問對廣告的偏好與性別有無關聯? 好不好男718女931215520 顯然,有兩格的實際次數小于5,其理論次數有可能小于5,故需用校正公式。 說明對廣告的偏好與性別沒有關聯。01. 07200805151282201937202201. 02 484. 3205. 013) 與 的關系 在22列聯表的獨立樣本 檢驗中,不僅可以檢驗兩種變量的相倚關系,而且還可以對“二分變量”的相關系數進行顯著性檢驗。只要 檢驗結果是顯著的,就可以檢驗 是否與零相關的虛無假設有顯著的差別,這是因為二者之存在著以下關系: 2r22r22NrNr2(二)相關樣本四格表檢驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 培訓班上課管理制度
- 多媒體安全管理制度
- 氬氣罐安全管理制度
- 力容器安全管理制度
- 商務接待及管理制度
- 后評價內部管理制度
- 學校體檢室管理制度
- 商場處罰單管理制度
- 客貨郵站點管理制度
- 河南省洛陽市強基聯盟2024-2025學年高二下學期5月月考英語試卷
- 期末試卷(五)(含答案含聽力原文無聽力音頻)-2024-2025學年人教PEP版英語(新教材)三年級下冊
- 養老護理員四級考試題庫及答案
- 2024-2025 學年八年級英語下學期期末模擬卷 (蘇州專用)原卷
- 2025年大學生創業培訓考試試卷及答案
- 安徽省宿州市碭山縣2023-2024學年八年級下學期期末數學試題
- 2025江蘇鹽城燕舞集團有限公司招聘58人筆試參考題庫附帶答案詳解析
- 車禍現場急救護理規范
- 2025年天津市武清區等5地中考二模歷史試題(含答案)
- 2024-2025 學年七年級英語下學期期末模擬卷 (深圳專用)原卷
- 2025國開電大《個人與團隊管理》形考任務1-10答案
- 湖南2024生地會考試卷及答案
評論
0/150
提交評論