數學知識導航獨立性檢驗的應用_第1頁
數學知識導航獨立性檢驗的應用_第2頁
數學知識導航獨立性檢驗的應用_第3頁
數學知識導航獨立性檢驗的應用_第4頁
數學知識導航獨立性檢驗的應用_第5頁
已閱讀5頁,還剩4頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

學必求其心得,業必貴于專精學必求其心得,業必貴于專精學必求其心得,業必貴于專精2。2獨立性檢驗2。3獨立性檢驗的基本思想2.4獨立性檢驗的應用自主整理1。兩個變量是否相關聯,可通過對這一問題的調查數據,進行_______________。2.統計學選取統計量_______________的大小來檢驗變量之間是否獨立.高手筆記1.變量的不同值表示個體所屬的不同類別,這樣的變量叫作分類變量,可以用列聯表來表示。2.在統計中,用以下結果對變量的獨立性進行判斷:其中χ2=.(1)當χ2≤2.706時,沒有充分的證據判定變量A、B有關聯,可以認為變量A、B是沒有關聯的.(2)當χ2>2.706時,有90%的把握判定變量A、B有關聯。(3)當χ2〉3。841時,有95%的把握判定變量A、B有關聯。(4)當χ2〉6。635時,有99%的把握判定變量A、B有關聯。3。一般地,假設兩個分類變量A和B,它們的值域分別為{x1,x2},{y1,y2}.其樣本頻數列聯表如下:y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d可以利用獨立性檢驗來計算出χ2的值來判斷A與B的有關系的可能性大小,獨立性檢驗的基本思想類似于數學中的反證法,要確認兩個分類變量A、B有關系,這個結論成立的可信程度,首先假設該結論不成立,即假設結論“兩個分類變量沒有關系"成立。在該假設下我們構造的隨機變量χ2應該很小,如果由觀測數據計算得到的χ2很大,則在一定程度上說明假設不合理。根據隨機變量χ2的含義,可以通過P(χ2≥6。635)≈0.01來評價假設不合理的程度,由實際計算出χ2>6。635,說明假設不合理的程度約為99%,即兩個分類變量有關系這一結論成立的可信度為99%.名師解惑為什么統計學中用χ2=的大小來檢驗變量之間是否獨立呢?剖析:設A、B為兩個變量,每個變量都可以取兩個值.變量A:A1,A2=,變量B:B1,B2=.通過觀察得到數據為BAB1B2總計A1aba+bA2cdc+d總計A+cb+dn=a+b+c+d則P(A1B1)=,P(A1)=,P(B1)=。若=·,即P(A1B1)=P(A1)P(B1),則A1、B1相互獨立。同理,若=·,則A1、B2相互獨立.若=·,則A2、B1相互獨立.若=·,則A2、B2相互獨立.但是,,等表示的是頻率,不同于概率。即使變量之間相互獨立,式子兩邊也不一定恰好相等,但是當兩邊相差很大時,變量之間就不獨立,即|·|很大時,變量之間不獨立.同理,|·|,|·|,|·|很大時,變量之間也不獨立.可用χ2=n[+++]=的大小來檢驗變量之間是否獨立。檢驗結果標準為:(1)當χ2≤2。706時,變量A、B沒有關聯.(2)當χ2〉2。706時,有90%的把握判定變量A、B有關聯.(3)當χ2〉3。841時,有95%的把握判定變量A、B有關聯。(4)當χ2>6.635時,有99%的把握判定變量A、B有關聯。講練互動【例1】對196個接受心臟搭橋手術的病人和196個接受血管清障手術的病人進行了3年的跟蹤研究,調查他們是否又發作過心臟病,調查結果如下表所示:又發作過心臟病未發作心臟病合計心臟搭橋手術39157196血管清障手術29167196合計68324392試根據上述數據比較這兩種手術對病人又發作心臟病的影響有沒有差別。分析:從所給的列聯表中可知病人有兩種類型:做過心臟搭橋手術和做過血管清障手術,每種類型又有兩種情況:又發作心臟病和未發作心臟病.問題是用表中所給出的數據來檢驗上述兩種狀態是否有關系,這是一個獨立性檢驗問題,解決的方法是先計算隨機變量χ2的觀測值k,用k的大小來決定是否又發作心臟病與心臟搭橋手術有關還是無關.解:假設做過心臟搭橋手術與又發作心臟病沒有關系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得χ2的觀測值為χ2===1.78。因為χ2=1.78<2。706,所以我們沒有理由說心臟搭橋手術與又發作心臟病有關系。綠色通道本題可利用χ2=求出χ2的值,再利用臨界值的大小關系來判斷,解題時應注意準確代入數據進行計算。變式訓練1。為了考察某種藥物預防疾病的效果,進行動物實驗,得到如下的列聯表:患病未患病總計服用藥104555沒服用藥203050總計3075105請問能有多大把握認為藥物有效?解:a=10,b=45,c=20,d=30,a+b=55,c+d=50,a+c=30,b+d=75,n=105,χ2===6.11,因為χ2=6。11>3。841,從而有95%的把握認為藥物有效。【例2】甲、乙兩個班級進行一門考試,按照學生考試成績優秀和不優秀統計成績后,得到如下列聯表:優秀不優秀總計甲班103545乙班73845總計177390利用列聯表的獨立性檢驗估計,認為“成績與班級有關系"犯錯誤的概率是多少?分析:求出χ2,然后查表求概率。解:假設成績優秀與班級無關系,則有a=10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90,代入χ2公式得χ2的值.χ2===0。653,由于χ2=0.653〈2.706,所以沒有充分證據說明優秀與班級有關系,認為成績與班級有關系犯錯誤的概率為99%.綠色通道從本題可知,學習成績主要取決于個人努力的結果,與所在班級的關系不大.所以同學們要從自身找原因,不要強調外界環境。利用公式計算χ2的值時,一定要計算準確.變式訓練2.某企業為考察生產同一種產品的甲、乙兩條生產線的產品合格率,同時各抽取100件產品,檢驗后得到如下列聯表:生產線與產品合格率列聯表合格不合格總計甲線973100乙線955100總計1928200請問甲、乙兩線生產的產品合格率在多大程度上有關系?解:χ2===0。5208〈2.706.∴甲、乙兩條生產線生產的產品合格率在很大程度上沒有關系。【例3】通過隨機詢問72名不同性別的大學生在購買食物時是否看營養說明,得到如下列聯表:女男總計讀營養說明162844不讀營養說明20828總計363672請問性別和讀營養說明之間在多大程度上有關系?分析:計算χ2,然后查表求概率.解:a=16,b=28,c=20,d=8,a+b=44,c+d=28,a+c=36,b+d=36,n=72。因此χ2的觀測值為χ2===8。416。因為8.416>6.635從而有99%的把握認為性別與讀營養說明之間有關系。綠色通道統計方法是可能犯錯誤的,好的統計方法就是要降低犯錯誤的概率.兩變量之間有無關聯,可通過計算χ2的值來衡量.變式訓練3.調查某公司銷售員的業績與性別的關系,得到下表,試問能有多大的把握認為銷售員的業績與性別有關系.業績性別出色一般合計男172542女62329合計234871解:χ2=≈3。067〉2.706.因此,有90%的把握認為銷售員的業績與性別有關系。【例4】在研究某種新措施對豬白痢的防治效果問題時,得到以下數據:存活數死亡數合計對照11436150新措施13218150合計24654300試問新措施對防治豬白痢是否有效?分析:利用χ2計算有多大把握認為新措施對防治豬白痢是有效果的.解:設新措施對防治豬白痢沒有效果.由題意,可知a=114,b=36,c=132,d=18,a+b=150,c+d=150,a+c=246,b+d=54,n=300,代入公式,可得χ2===7.317.因為χ2=7.317〉6。635,因此我們有99%的把握認為新措施對防治豬白痢是有效果的。綠色通道利用獨立性檢驗,我們可以對新藥對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論