




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1.2獨立性檢驗的基本思想及其初步應(yīng)用(一)2023/1/1整理ppt問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設(shè)“面包份量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個平均值不大于950g”是一個與假設(shè)“面包份量足”矛盾的小概率事件;這個小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。2023/1/1整理ppt一:假設(shè)檢驗問題的原理假設(shè)檢驗問題由兩個互斥的假設(shè)構(gòu)成,其中一個叫做原假設(shè),用H0表示;另一個叫做備擇假設(shè),用H1表示。例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。這個假設(shè)檢驗問題可以表達為:
H0:面包份量足←→H1:面包份量不足2023/1/1整理ppt二:求解假設(shè)檢驗問題考慮假設(shè)檢驗問題:H0:面包分量足←→H1:面包分量不足在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;如果樣本使得這個小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。求解思路:2023/1/1整理ppt獨立性檢驗本節(jié)研究的是兩個分類變量的獨立性檢驗問題。在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學(xué)課程有影響?等等。2023/1/1整理ppt吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所隨機地調(diào)查了9965人,得到如下結(jié)果(單位:人)列聯(lián)表在不吸煙者中患肺癌的比重是
在吸煙者中患肺癌的比重是
說明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。0.54%2.28%探究2023/1/1整理ppt不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199651、列聯(lián)表2、三維柱形圖3、二維條形圖不患肺癌患肺癌吸煙不吸煙不患肺癌患肺癌吸煙不吸煙080007000600050004000300020001000從三維柱形圖能清晰看出各個頻數(shù)的相對大小。從二維條形圖能看出,吸煙者中患肺癌的比例高于不患肺癌的比例。通過圖形直觀判斷兩個分類變量是否相關(guān):2023/1/1整理ppt不吸煙吸煙患肺癌比例不患肺癌比例4、等高條形圖等高條形圖更清晰地表達了兩種情況下患肺癌的比例。2023/1/1整理ppt
上面我們通過分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實是否真的如此呢?這需要用統(tǒng)計觀點來考察這個問題。
現(xiàn)在想要知道能夠以多大的把握認為“吸煙與患肺癌有關(guān)”,為此先假設(shè)
H0:吸煙與患肺癌沒有關(guān)系.不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒有關(guān)系”等價于“吸煙與患肺癌獨立”,即假設(shè)H0等價于P(AB)=P(A)P(B).2023/1/1整理ppt因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強。不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以在H0成立的條件下應(yīng)該有2023/1/1整理ppt
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上述分析,我們構(gòu)造一個隨機變量-----卡方統(tǒng)計量(1)若H0成立,即“吸煙與患肺癌沒有關(guān)系”,則K2應(yīng)很小。根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計算得到K2的觀測值為:那么這個值到底能告訴我們什么呢?(2)
獨立性檢驗2023/1/1整理ppt在H0成立的情況下,統(tǒng)計學(xué)家估算出如下的概率
即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。
也就是說,在H0成立的情況下,對隨機變量K2進行多次觀測,觀測值超過6.635的頻率約為0.01。思考
答:判斷出錯的概率為0.01。2023/1/1整理ppt判斷是否成立的規(guī)則如果,就判斷不成立,即認為吸煙與患肺癌有關(guān)系;否則,就判斷成立,即認為吸煙與患肺癌有關(guān)系。獨立性檢驗的定義上面這種利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨立性檢驗。在該規(guī)則下,把結(jié)論“成立”錯判成“不成立”的概率不會差過即有99%的把握認為不成立。2023/1/1整理ppt獨立性檢驗的基本思想(類似反證法)(1)假設(shè)結(jié)論不成立,即“兩個分類變量沒有關(guān)系”.(2)在此假設(shè)下我們所構(gòu)造的隨機變量K2應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到K2的觀測值k很大,則在一定可信程度上說明不成立.即在一定可信程度上認為“兩個分類變量有關(guān)系”;如果k的值很小,則說明由樣本觀測數(shù)據(jù)沒有發(fā)現(xiàn)反對的充分證據(jù)。(3)根據(jù)隨機變量K2的含義,可以通過評價該假設(shè)不合理的程度,由實際計算出的,說明假設(shè)合理的程度為99%,即“兩個分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99%.2023/1/1整理ppt怎樣判斷K2的觀測值k是大還是小呢?這僅需要確定一個正數(shù),當時就認為K2的觀測值k大。此時相應(yīng)于的判斷規(guī)則為:如果,就認為“兩個分類變量之間有關(guān)系”;否則就認為“兩個分類變量之間沒有關(guān)系”。----臨界值按照上述規(guī)則,把“兩個分類變量之間有沒關(guān)系”錯誤的判斷為“兩個分類變量之間有關(guān)系”的概率為P().在實際應(yīng)用中,我們把解釋為有的把握認為“兩個分類變量之間有關(guān)系”;把解釋為不能以的把握認為“兩個分類變量之間有關(guān)系”,或者樣本觀測數(shù)據(jù)沒有提供“兩個分類變量之間有關(guān)系”的充分證據(jù)。2023/1/1整理ppt思考:
利用上面的結(jié)論,你能從列聯(lián)表的三維柱形圖中看出兩個分類變量是否相關(guān)呢?表1-112x2聯(lián)表
一般地,假設(shè)有兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d2023/1/1整理ppt
若要判斷的結(jié)論為:H1:“X與Y有關(guān)系”,可以按如下步驟判斷H1成立的可能性:2、可以利用獨立性檢驗來考察兩個分類變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。1、通過三維柱形圖和二維條形圖,可以粗略地判斷兩個變量是否有關(guān)系,但是這種判斷無法精確地給出所得結(jié)論的可靠程度。(1)在三維柱形圖中,主對角線上兩個柱形高度的乘積ad與副對角線上兩個柱形高度的乘積bc相差越大,H1成立的可能性就越大。(2)在二維條形圖中,可以估計滿足條件X=x1的個體中具有Y=y1的個體所占的比例,也可以估計滿足條件X=x2的個體中具有Y=y1的個體所占的比例。兩個比例相差越大,H1成立的可能性就越大。2023/1/1整理ppt在實際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過下表確定臨界值:0.500.400.250.150.100.4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具體作法是:(1)根據(jù)實際問題需要的可信程度確定臨界值;(2)利用公式(1),由觀測數(shù)據(jù)計算得到隨機變量的觀測值;(3)如果,就以的把握認為“X與Y有關(guān)系”;否則就說樣本觀測數(shù)據(jù)沒有提供“X與Y有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 民族運動會勝負結(jié)果確認及獎品發(fā)放協(xié)議
- 化工產(chǎn)品采購合同寶庫
- 醫(yī)療法律法規(guī)培訓(xùn)
- 住宅小區(qū)車位買賣合同書模板
- 電力維修班組與個人安全協(xié)議
- 低壓開關(guān)柜低壓配電設(shè)備安裝與維護合作協(xié)議
- 餐飲店員工勞動合同與福利待遇協(xié)議
- 汽車抵押貸款反擔(dān)保條款范本
- 老齡化社區(qū)車位租賃與無障礙設(shè)施安裝服務(wù)合同
- 茶樓裝修施工人員工資與福利合同模板
- 具有形狀記憶功能高分子材料的研究進展
- 2023國機集團財務(wù)資產(chǎn)紀檢監(jiān)察中心公開招聘2人歷年高頻難易度、易錯點模擬試題(共500題)附帶答案詳解
- PCBA元件焊點強度推力測試標準
- 食用菌的保鮮技術(shù)研究進展
- 可持續(xù)建筑(綠色建筑)外文翻譯文獻
- 2023年春國家開放大學(xué)工具書與文獻檢索形考任務(wù)1-4及答案
- 2023年03月北京海淀區(qū)衛(wèi)生健康委所屬事業(yè)單位招聘430人(第一次)筆試參考題庫含答案解析
- ISTA-3A(中文版)運輸-試驗標準
- 小學(xué)科學(xué)-蠶變了新摸樣教學(xué)課件設(shè)計
- 企業(yè)資產(chǎn)評估工作底稿模版
- 人教版五年級下冊分數(shù)的基本性質(zhì)說課稿
評論
0/150
提交評論