獨立性檢驗 課件_第1頁
獨立性檢驗 課件_第2頁
獨立性檢驗 課件_第3頁
獨立性檢驗 課件_第4頁
獨立性檢驗 課件_第5頁
已閱讀5頁,還剩20頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

3.1獨立性檢驗

問題:

數學家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實際質量。一年后,這位數學家發現,所記錄數據的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設“面包份量足”,則一年購買面包的質量數據的平均值應該不少于1000g;“這個平均值不大于950g”是一個與假設“面包份量足”矛盾的小概率事件;這個小概率事件的發生使龐加萊得出推斷結果。一:假設檢驗問題的原理

假設檢驗問題由兩個互斥的假設構成,其中一個叫做原假設,用H0表示;另一個叫做備擇假設,用H1表示。例如,在前面的例子中,原假設為:H0:面包份量足,備擇假設為:H1:面包份量不足。這個假設檢驗問題可以表達為:

H0:面包份量足←→H1:面包份量不足二:求解假設檢驗問題考慮假設檢驗問題:

H0:面包分量足←→H1:面包分量不足在H0成立的條件下,構造與H0矛盾的小概率事件;如果樣本使得這個小概率事件發生,就能以一定把握斷言H1成立;否則,斷言沒有發現樣本數據與H0相矛盾的證據。求解思路分析:本節研究的是兩個分類變量的獨立性檢驗問題。獨立性檢驗在日常生活中,我們常常關心分類變量之間是否有關系:例如,吸煙是否與患肺癌有關系?性別是否對于喜歡數學課程有影響?等等。例1.某醫療機構為了了解患慢性支氣管炎與吸煙是否有關,進行了一次抽樣調查,共調查了339名50歲以上的人,其中吸煙者205人,不吸煙者134人.調查結果是:吸煙的205人中有43人患呼吸道疾病(簡稱患病),162人未患呼吸道疾病(簡稱未患病);不吸煙的134人中有13人患病,121人未患病.問題:根據這些數據能否斷定“患慢性支氣管炎與吸煙有關”?(1)為了研究這個問題,將上述數據用下表來表示:患病未患病合計吸煙43162205不吸煙13121134合計56283339(2)估計吸煙者與不吸煙者患病的可能性差異:在吸煙的人中,有的人患病,在不吸煙的人中,有的人患病.問題:由上述結論能否得出患病與吸煙有關?把握有多大?

(1)假設:患病與吸煙沒有關系.若將表中“觀測值”用字母表示,則得下列2×2列聯表:不吸煙(患病(B)未患病()合計吸煙An11n12n1+不吸煙n21n22n2+合計n+1n+2n

即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,|n11n22-n21n12|越小,患病與吸煙之間的關系越弱,否則,關系越強.近似的判斷方法:設n=n11+n21+n12+n22,如果H0成立,則在吸煙的人中患病的比例與不吸煙的人中患病的比例應差不多,由此可得,

上面的話的意思是指事件A與B獨立,這時應該有P(AB)=P(A)P(B)成立,

我們用H0表示上式,即H0:P(AB)=P(A)P(B).并稱之為統計假設,當H0成立時,下面的三個式子也成立:根據概率的統計定義,上面提到的眾多事件的概率都可以用相應的頻率來估計。例如P(AB)的估計為P(A)的估計為,P(B)的估計為,……于是與應該很接近,……。或者說應該比較小.從而也應該比較小。(2)卡方統計量:為了消除樣本對上式的影響,通常用卡方統計量(χ2

)來進行估計.卡方χ2統計量公式:用它的大小可以決定是否拒絕原來的統計假設H0,如果算出的χ2值較大,就拒絕H0,也就是拒絕“事件A與事件B無關”,從而就認為它們是有關的了(3)兩個臨界值:3.841與6.635.

經過對χ2統計量分布的研究,已經得到了兩個臨界值:3.841與6.635。當根據具體的數據算出的χ2>3.841時,有95%的把握說事件A與事件B有關;當χ2>6.635時,有99%的把握說事件A與事件B有關;當χ2<3.841時,認為事件A與事件B無關;

象以上這種用χ2統計量研究吸煙與患呼吸道疾病是否有關等問題的方法稱為獨立性檢驗.

對于例1,最理想的解決辦法是向所有的50歲以上的人作調查,然后對所得的數據進行統計處理,但這花費的代價太大,實際上也是行不通的。339個人相對于全體50歲以上的人,只是一小部分回憶一下數學必修3中學過的總體與樣本的關系,當用樣本平均數,樣本標準差去估計總體的相應的數字特征時,由于抽樣的隨機性,結果并不惟一。現在的情況類似,我們用部分對全體作推斷,推斷可能正確,也可能錯誤,例如我們知道,不少的中老年煙民的身體很好,沒有患慢性支氣管炎;而又有很多的從不吸煙的中老年人體質很差,患有慢性支氣管炎。如果抽取的339個調查對象中很多人來自上述兩個群體,試想會得出什么結論吧。我們說有95%(或99%)的把握說事件A與事件B有關,是指推斷犯錯誤的可能性為5%(或1%),這也是常常說成是“有95%(或99%)的概率”,其含義是一樣的。解:由公式因為7.469>6.635,所以我們有99%的把握說:50歲以上的人患慢性支氣管炎與吸煙有關。Ⅱ類1類2合計Ⅰ類An11n12n1+類B

n21n22n2+合計n+1n+2n獨立性檢驗的一般步驟:一般地,對于兩個研究對象Ⅰ和Ⅱ,Ⅰ有兩類取值:類A和類B(如吸煙與不吸煙),Ⅱ也有兩類取值:類1和類2(如患呼吸道疾病與不患呼吸道疾病),得到如下表所示:類類

類類推斷“Ⅰ和Ⅱ有關系”的步驟為:第一步,提出假設H0:兩個分類變量Ⅰ和Ⅱ沒有關系;第二步,根據2×2列聯表和公式計算χ2統計量;第三步,比對兩個臨界值,作出判斷.例2:對196個接受心臟搭橋手術的病人和196個接受血管清障手術的病人進行3年跟蹤研究,調查他們是否又發作過心臟病,調查結果如下表所示:又發作過心臟病未發作過心臟病合計心臟搭橋手術39157196血管清障手術29167196合計68324392

試根據上述數據比較兩種手術對病人又發作心臟病的影響有沒有差別。解:這是一個2×2列聯表的獨立性檢驗問題,由公式因為1.780<3.841,我們沒有理由說“心臟搭橋手術”與“又發生過心臟病”有關,可以認為病人又發作心臟病與否跟他做過何種手術無關。例3.某大型企業人力資源部為了研究企業員工工作積極性和對待企業改革態度的關系,隨機抽取了189名員工進行調查,所得的數據如下表所示:積極支持企業改革不太贊成企業改革合計工作積極544094工作一般326395合計86103189

對于人力資源部的研究項目,根據上述數據能得出什么結論?解:這是一個2×2列聯表的獨立性檢驗問題,由公式因為10.759>6.635,所以有99%的把握說:員工“工作積極”與“積極支持企業改革”是有關的。可以認為企業的全體員工對待企業改革的態度與其工作積極性是有關的。例4.在一次惡劣氣候的飛行航程中調查男女乘客在機上暈機的情況如下表所示,根據此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論