




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.3列聯表與獨立性檢驗1.分類變量在現實生活中,人們經常需要回答一定范圍內的兩種現象或性質之間
是否存在關聯性或互相影響的問題.例如:就讀不同學校是否對學生的成績有影響,不同班級學生用于體育鍛煉的時間是否存在區別,吸煙是否會增加患肺癌的風險等。在討論上述問題時,為了表述方便,
我們經常會使用一種特殊的隨機變量,
以區別
不同的現象或性質
,
這類隨機變量稱為分類變量.分類變量:用實數表示不同的現象或性質.如:班級:1、2、3,
男生、女生:0、1.本節主要討論取值于{0,1}的分類變量的關聯性問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了普查.全校生
的普查數據如下:523名女生中有331名經常鍛煉,601名男生中有473名經常鍛煉.你能利
用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎?解1:比較經常鍛煉的學生在女生和男中的比率.f0
=
經常
生數,f1
=
經常
生數.
≈
0.633,f1
=
≈
0.787.
f1
0
=
0.787-0.633=0.
154.男生經常鍛煉的比率比女生高出15.4個百分點,所以該校的女生和男生在體育鍛
煉的經常性方面有差異,而且男生更經常鍛煉.男生總數鍛煉的男女生總數鍛煉的女若性別對體育鍛煉的經常性沒有影響,可描述為
P
(Y
=
1
X
=
0)
=
P(Y
=
1
X
=
1)若性別對體育鍛煉的經常性有影響,可描述為
P
(Y=1X=0)
≠P(Y=1X=1)性別鍛煉合計不經常(Y
=0)經常(Y
=1)女生(X
=0)192331523男生(X
=1)128473601合計3208041124P(Y
=
1X
=
1)>P(Y
=
1X
=
0)[0,該生不經常鍛煉,Y
=
{0,該生為女生,1,該生為男生,,解2:
對于Ω中的每一名學生,分別令∴性別對體育鍛煉的經常性有影響l1
,該生經常鍛煉,[X
=
{lXY合計Y
=0Y=1X
=0aba+bX=1cdc+d合計a+cb
+dn
=a+b
+c+d2.2×2列聯表的概念分類變量X和Y的抽樣數據的2×2列聯表2×2列聯表給出成對分類變量數據的交叉分類頻數例1.為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數據:甲校43名學生中有10名數學成績優秀;乙校45名學生中有7名
數學成績優秀.試分析兩校學生中數學成績優秀率之間是否存在差異.解:用Ω表示兩所學校的全體學生構成的集合.考慮以Ω為樣本空間的古典概型.對
于Ω中每一名學生,定義分類變量X和Y如下:因此,甲校學生中數學成績不優秀和數學成績優秀的頻率分別為
≈
0.7674,
≈
0.2326.乙校學生中數學成績不優秀和數學成績優秀的頻率分別為
≈
0.8444,
≈
0.
1556.學校數學成績合計不優秀
Y=優
=甲校
(乙校(X
1)387合計7117[0,
該生數學成績不優秀,Y
=
{0,
該生來
自
甲校,1,該生來
自
乙校,,l
1
,該生數學成績優秀,[X
={l兩個分類變量之間關聯關系的定性分析的方法:(1)頻率分析法:通過對樣本的每個分類變量的不同類別事件發生的頻
率大小進行比較來分析分類變量之間是否有關聯關系.(2)圖形分析法:與表格相比,圖形更能直觀地反映出兩個分類變量間是
否互相影響,常用等高堆積條形圖展示列聯表數據的頻率特征.你認為“兩校學生的數學成績優秀率存在差異”這一結論是否有可能是錯誤的?有可能“兩校學生的數學成績優秀率存在差異
”這個結論是根據兩個頻率間存在差異推斷出
來的.有可能出現這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但
兩校學生的數學成績優秀率實際上是沒有差別的.對于隨機樣本而言,因為頻率具有隨
機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,
犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,
同時也希望能對出
現錯誤推斷的概率有一定的控制或估算.獨立性檢驗方法假定我們通過簡單隨機抽樣得到了X和Y的抽樣數據列聯表,如果零假設H0成立,則應滿足
≈
,
即ad-bc≈0.因此在列聯表中|ad-bc|越小,說明兩個分類變量之間關系越弱
;
|ad-bc|越大,說明兩個分類變量之間關系越強.為了使不同樣本容量的數據有統一的評判標準
基于上述分析我們構造一個隨機變量
用χ2取值的大小作為判斷零假設H0是否成立的依據,當它比較大時推斷H0不成
立,否則認為H0成立。這種利用χ2
的取值推斷分類變量X和Y是否獨立的方法稱為χ2
獨立性檢驗,讀作“卡方獨立性檢驗
”,簡稱獨立性檢驗(test
of
independence).3.獨立性檢驗公式及定義提出零假設(原假設)H0
:分類變量X和Y獨立4.臨界值的定義對于任何小概率值α
,
可以找到相應的正實數xα
,
使得P(x≥xα)=α成立,我們稱xα
為
α
的臨界值,這個臨界值可作為判斷χ2大小的標準,概率值α越小,臨界值xα越大.χ2獨立性檢驗中幾個常用的小概率值和相應的臨界值.基于小概率值
α
的檢驗規則:當
χ2
≥x
α
時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α
,
即大約有(1-α)
的可能性認為X和Y有關系;當
χ2
<x
α
時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.0.10.050.010.0050.001xα2.7063.8416.6357.87910.828例2
某兒童醫院用甲、乙兩種療法治療小兒消化不良.采用有放回簡單隨機抽樣的方法對治療情況進行檢查,得到了如下數據:抽到接受甲種療法的患兒67名,其中未治愈
15名,治愈52名;抽到接受乙種療法的患兒69名,其中未治愈6名,治愈63名.試根據小概
率值α=0.005的獨立性檢驗,分析乙種療法的效果是否比甲種療法好.解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯表,療法療效合計未治愈治愈甲155267乙66369合計21115136沒有充分證據推斷H0不成立,
因此可以認為
H0成立,即認為
兩種療法效果沒有差異.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
0.00152,60則當m取下面何值時,X與Y的關系最弱A.8
B.9
√C.14
D.19解析由10×26≈18m
,解得m
≈14.4
,所以當m
=14時,X與Y的關系最弱.y1y2x11018x2m26在列聯表中|ad-bc|越小,說明兩個分類變量之間關系越弱
;
|ad-bc|越大,
說明兩個分類變量之間關系越強.3.假設有兩個分類變量X與Y,它們的可能取值分別為{x1
,x2}和{y1,y2},其2×2列聯表為XY合計Y
=0Y=1X
=0aba+bX=1cdc+d合計a+cb
+dn
=a+b
+c+d因為|ad-bc|的值越大,兩個分類變量有關系的可能性就越大,故選A.5.在2×2列聯表中,兩個比值相差越大
,
兩個分類變量有關系的可能性就越大
,那么這兩個比值為
√6.(1)為了判定兩個分類變量X和Y是否有關系,應用獨立性檢驗法算的χ2為5.003
,又已知P(χ2
≥3.841)
=0.05
,P(χ2
≥6.635)
=0.01
,則下列說法正確的是
(
)√A.在犯錯誤的概率不超過5%的前提下,認為“X和Y有關系
”B.在犯錯誤的概率不超過5%的前提下,認為“X和Y沒有關系
”C.依據小概率值α
=0.01的獨立性檢驗,認為“X和Y有關系
”D.依據小概率值α
=0.01的獨立性檢驗,認為“X和Y沒有關系
”解:
∵
3.841
=x0.05<χ2
=5.003<6.635
=x0.01
,又P(χ2
≥3.841)
=0.05,:依據小概率值α
=0.05的獨立性檢驗,在犯錯誤的概率不超過5%的前提
下,即大約95%的可能性認為“X和Y有關系
”.xαα0.10.050.010.0050.0012.7063.8416.6357.87910.828(2)有關獨立性檢驗的四個命題,其中不正確的是
(
)A.兩個變量的2×2列聯表中,對角線上數據的乘積之差的絕對值越大,說明兩個變量有關系成立的可能性就越大B.對分類變量X與Y的隨機變量χ2來說,χ2越小,認為“X與Y有關系
”的犯錯誤的概率越大√C.由獨立性檢驗可知:在犯錯誤的概率不超過5%的前提下,認為禿頂與患心臟病有關,我們說某人禿頂,那么他有95%的可能患有心臟病D.依據小概率值α
=0.01的獨立性檢驗,認為吸煙與患肺癌有關,是指在犯錯誤的概
率不超過1%的前提下,即大約有99%的可能性認為吸煙與患肺癌有關√
√xαα0.10.050.010.0050.0012.7063.8416.6357.87910.828解析由題意可知
a>5
,且15-a>5
,a∈Z,8.(多選)針對時下的“抖音熱
”,某校團委對“學生性別和喜歡抖音是否有關
”作了一次調查,其中被調查的男女生人數相同,男生喜歡抖音的人數占男生人數的
,女生喜歡抖音
的人數占女生人數的
,若在犯錯誤的概率不超過5%的前提下,認為是否喜歡抖音和性別
有關,則調查人數中男生可能有(
)人A.25
√B.45
√C.60
D.75解析設男生的人數為5n(n
∈N*)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CAEPI 23-2019地下式城鎮污水處理廠工程技術指南
- 星級酒店廚房承包協議書
- 公司員工合同培訓協議書
- 果園承包合同解除協議書
- 施工合同外工程量協議書
- 垂釣魚塘承包合同范本
- 快遞超市合作合同范本
- 司機入股車輛合伙協議書
- 汽車配件買賣合同范本
- 單位雇傭人員合同范本
- 難點02:總集篇·十六種陰影部分面積法專項練習-2024年小升初數學典型例題系列(解析版)2
- 全球經濟2025年全球經濟與貿易師考試試題及答案
- 2024年國家大劇院招聘真題
- 2025年四川省綿陽市富樂學校中考模擬英語試題(含答案)
- 文化產業發展的試題及答案
- 學校大型活動組織流程
- 2025年教育信息化2.0背景下教師跨學科教學能力培養模式創新與優化
- 2025-2030全球及中國協作機器人系統行業市場現狀供需分析及市場深度研究發展前景及規劃可行性分析研究報告
- 2025年高考政治搶押秘籍(江蘇專用)時政熱點05延遲法定退休年齡改革(學生版+解析)
- 財務公司調賬合同協議
- 品牌輸出合同協議
評論
0/150
提交評論