




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
8.3列聯表與獨立性檢驗學習目標1.通過實例,理解2×2的統計意義。2.通過實例,了解2×2列聯表與獨立性檢驗及其應用。重點:獨立性檢驗的基本思想、獨立性檢驗的基本方法;難點:χ2的含義、獨立性檢驗及其應用在現實生活中,人們經常需要回答一定范圍內的兩種現象或性質之間是否存在關聯性或互相影響的問題。例如:就讀不同學校是否對學生的成績有影響,不同班級學生用于體育鍛煉的時間是否存在區別,吸煙是否會增加患肺癌的風險等。為了方便表述eg:班級:1、2、3,男生、女生:0、1本節主要討論取值于{0,1}的分類變量的關聯性。在討論上述問題時,為了表述方便,我們經常會使用一種特殊的隨機變量,以區別不同的現象或性質,這類隨機變量稱為分類變量比較經常鍛煉的學生在女生和男中的比率.男生經常鍛煉的比率比女生高出15.4個百分點,所以該校的女生和男生在體育鍛煉的經常性方面有差異,而且男生更經常鍛煉。解法一:問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了普查.全校學生的普查數據如下:523名女生中有331名經常鍛煉;601名男生中有473名經常鍛煉。你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎?解法二:對于Ω中的每一名學生,分別令性別對體育鍛煉的經常性沒有影響:性別對體育鍛煉的經常性有影響:問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了普查.全校學生的普查數據如下:523名女生中有331名經常鍛煉;601名男生中有473名經常鍛煉。你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎?性別鍛煉合計不經常(Y=0)經常(Y=1)女生(X=0)男生(X=1)合計問題1:為了有針對性地提高學生體育鍛煉的積極性,某中學需要了解性別因素是否對本校學生體育鍛煉的經常性有影響,為此對學生是否經常鍛煉的情況進行了普查.全校學生的普查數據如下:523名女生中有331名經常鍛煉;601名男生中有473名經常鍛煉。你能利用這些數據,說明該校女生和男生在體育鍛煉的經常性方面是否存在差異嗎?19233112847352360132080411242?2列聯表的概念XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d分類變量X和Y的抽樣數據的2?2列聯表:用途:可以清晰的給出成對分類變量數據的交叉分類頻數。在上面問題的兩種解答中,使用了學校全部學生的調查數據,利用這些數據能夠完全確定解答問題所需的比率和條件概率.然而,對于大多數實際問題,我們無法獲得所關心的全部對象的數據,因此無法準確計算出有關的比率或條件概率.在這種情況下,上述古典概型和條件概率的觀點為我們提供了一個解決問題的思路.比較簡單的做法是利用隨機抽樣獲得一定數量的樣本數據,再利用隨機事件發生的頻率穩定于概率的原理對問題答案作出推斷。例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數據:甲校43名學生中有10名數學成績優秀;乙校45名學生中有7名數學成績優秀.試分析兩校學生中數學成績優秀率之間是否存在差異.例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數據:甲校43名學生中有10名數學成績優秀;乙校45名學生中有7名數學成績優秀.試分析兩校學生中數學成績優秀率之間是否存在差異.解:用Ω表示兩所學校的全體學生構成的集合.考慮以Ω為樣本空間的古典概型.對于Ω中每一名學生,定義分類變量X和Y如下:
學校數學成績合計不優秀(Y=0)優秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788所以
例1:為比較甲、乙兩所學校學生的數學水平,采用簡單隨機抽樣的方法抽取88名學生.通過測驗得到了如下數據:甲校43名學生中有10名數學成績優秀;乙校45名學生中有7名數學成績優秀.試分析兩校學生中數學成績優秀率之間是否存在差異.解:我們可以用等高堆積條形圖直觀地展示上述計算結果:
通過比較發現,兩個學校學生抽樣數據中數學成績優秀的頻率存在差異,甲校的頻率明顯高于乙校的頻率.依據頻率穩定于概率的原理,我們可以推斷那么甲校學生數學成績優秀的概率大于乙校學生數學成績優秀的概率.因此,可以認為兩校學生的數學成績優秀率存在差異,甲校學生的數學成績優秀率比乙校學生的高.方法總結判斷兩個分類變量之間相關性的方法:1.頻率分析法:通過列聯表中與的差可粗略地判斷,相差越大,分類變量的相關性越強,獨立性越弱2.圖形分析法:通過等高堆積條形圖的高度差可粗略地判斷,相差越大,分類變量的相關性越強,獨立性越弱跟蹤訓練1.1為了解對某班學生經常打籃球和性別是否有關,對該班40名學生進行了問卷調查,得到如下的2×2列聯表.性別打籃球合計經常不經常男生m420女生8
20合計
n40則m=_____,n=_____.1616題型一列聯表完善與分析跟蹤訓練1.2觀察下列各圖,其中兩個分類變量x,y之間關系最強的是()題型一列聯表完善與分析問題2:你認為“兩校學生的數學成績優秀率存在差異”這一結論是否有可能
是錯誤的?答:有可能。“兩校學生的數學成績優秀率存在差異”這個結論是根據兩個頻率間存在差異推斷出來的.有可能出現這種情況:在隨機抽取的這個樣本中,兩個頻率間確實存在差異,但兩校學生的數學成績優秀率實際上是沒有差別的.對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現錯誤推斷的概率有一定的控制或估算.獨立性檢驗方法1.獨立性檢驗:利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“
”,簡稱
.2.χ2=
,其中n=a+b+c+d.注意點:(1)χ2越大,相關性越強,獨立性越弱;χ2越小,相關性越弱,獨立性越強.(2)當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據推斷H0不成立
,可以認為X和Y獨立.提出零假設(原假設)H0:分類變量X和Y獨立.1.獨立性檢驗公式及定義
:卡方獨立性檢驗獨立性檢驗2.臨界值的定義:
α0.10.050.010.0050.001Xα2.7063.8416.6357.87910.828
題型二
隨機變量χ2的意義經典例題α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828A.大于10.828B.大于3.841C.小于6.635 D.大于2.706例2依據小概率值α=0.05的獨立性檢驗,認為“X與Y有關系”,隨機變量χ2必須滿足(
)經典例題【跟蹤訓練】2
題型二
隨機變量χ2的意義
解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯表,療法療效合計未治愈治愈甲155267乙66369合計21115136
不影響療法療效合計未治愈治愈甲155267乙66369合計21115136療法療效合計未治愈治愈乙66369甲155267合計21115136療法療效合計治愈未治愈甲521567乙63669合計11521136
解:零假設為H0:療法與療效獨立,即兩種療法效果沒有差異.將所給數據進行整理,得到兩種療法治療數據的列聯表,療法療效合計未治愈治愈甲155267乙66369合計21115136
解:
因此可以推斷乙種療法的效果比甲種療法好。方法總結獨立性檢驗的基本步驟:①提出零假設H0:X和Y相互獨立,并給出在問題中的解釋②根據抽樣數據整理出2x2列聯表③計算,并與臨界值Xα比較④結論:基于小概率值α的檢驗規則:當χ2≥Xα時,我們推斷H0不成立,認為X與Y不獨立,該推斷犯錯的概率不超過α當χ2<Xα時,我們沒有充分證據推斷H0不成立,可以認為X和Y獨立.沒關系,無差異小概率事件,不可能發生經典例題【跟蹤訓練】3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- CJ/T 31-1999液化石油氣鋼瓶金相組織評定
- 智能控制與決策優化-洞察闡釋
- 【知衣】2025Q1中高價位段男裝數據復盤
- DB13T 3015-2018 水產品冷鏈物流操作規程
- 阿拉善盟教育科研課題申報攻略指南
- 翡翠首飾文化講座行業深度調研及發展項目商業計劃書
- 浙江寧波消控考試試題及答案
- 《國學修養》課件魅力女性之心態篇
- 常用的穩定劑和凝固劑PART0364課件
- 云南本科自考考試題庫及答案
- 2021上海慢行交通規劃設計導則
- EOD項目策劃、融資、落地、偏差、風險
- 漢堡店創業計劃書
- GB/T 10322.1-2023鐵礦石取樣和制樣方法
- 二手車鑒定評估表
- 中國思想史 馬工程329P
- 2023年高考全國新高考1卷英語含答案(適用地區山東、廣東、湖南、湖北、河北、江蘇、福建、浙江)
- 成人經鼻胃管喂養臨床實踐指南
- 管廊鋼結構防腐工程施工方案
- 林芝工布書畫院建筑及景觀工程項目
- QC提高老年患者靜脈留置針一次穿刺成功率
評論
0/150
提交評論