




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十講列聯表第十講 列聯表v第一節 概念v1、研究內容v1)研究兩定類變量的關系v2)為研究y的分類是否與x之分類有關,將數據先按x分類,再分別統計x分類情況下y的分類。v3)按兩個定類變量進行交叉分類的頻次分配表,即二維列聯表。第十講列聯表4、列聯表的一般形式Nij:x=xi y=yj時所具有的頻次y xx1x2. . . xcy1N11N21. . .Nc1y2N12N22. . .Nc2.yrN1rN2r. . .Ncr第十講列聯表學生上網調查(統計各項比例,能發現什么問題?)男 生 女生聊天玩游戲網戀學習 20 20 50 50 15 15 15 15 第十講列聯表2、列聯表中變量的分
2、布v1)聯合分布v對于二變量來說,為了知道分布,集合中的變量值,必須同時具有x和y兩個變量的取值。v( x1 y1 N11)v( x2 y2 N12)v( x1 yr N1r) 此稱聯合分布v( xi yj Nij)v( xc yr Ncr)vNij 表示頻次時 聯合頻次分布表v 表示概率時 聯合概率分布表v后者可以通過前者求出NNpijijcirjijNN11111cirjijp第十講列聯表v2)邊緣分布:v對聯合分布進行簡比,只研究其中某一變量的分布,而不管另一變量的取值,這樣就得到邊緣分布。v按行加總 y的邊緣分布:v按列加總 x的邊緣分布:ppppyrcrrrryp21ppppxccr
3、cccxp21第十講列聯表v3)條件分布:v將其中一個變量控制起來取固定值,再看另一變量的分布,即條件分布。v控制x時,條件分布中的每一項都以邊緣分布的 為分母v控制y時,條件分布中的每一項都以邊緣分布的 為分母NNNc*2*1NNNr*2*1*第十講列聯表3、列聯表中的相互獨立性:v1)列聯表研究定類變量之間的關系,實際上是通過條件分布的比較進行的。v如果兩個變量之間沒有關系,則稱變量之間是相互獨立的。v2)如果兩個變量之間是相互獨立的,則必然存在變量的條件分布與其邊緣分布相同 。第十講列聯表v條件分布=邊緣分布是列聯表檢驗的基礎:(控制x時)j*i*ijj*Iijj* iij1*221*1
4、11PPP NNNNNNNNNNNNNNNN第十講列聯表第二節 列聯表的檢驗v一、原假設:v將總體中變量間無關系或相互獨立作為檢驗的原假設。v總體 和 未知時,用樣本 和 代替。pppHjiij*0:pi*pj*pi*pj*nnpii*nnpjj*第十講列聯表二、統計量v v x2cirjijEEnxijij1122112crxnnnEjiij*npE nnnnnnnpppEjijiijij*第十講列聯表統計量的討論v1、對于22列聯表,由于格數過少,為減少作為離散觀測值與作為連續型變量x值之間的偏差,可作連續性修正:v2、二項總體 統計量 為總體成數2121225 . 0ijijEEnxij
5、ij EEnEEnx221225 . 05 . 02211pEn01pEn012p0第十講列聯表男女休閑愛好 男 女 泡吧 80 30 逛商店 20 70第十講列聯表對開卷考試的看法 態度 贊成 反對 人數 60 40第十講列聯表3、對多項總體:v統計量:v 4、使用統計量 對列聯表進行檢驗,每一格值的 要保持在一定數目之上。如果有的格值 過小,那么在計算 值時 值的波動就會較大。riiEEnxii12212rxpEiin0 x2EijEijx2EEnijijij2第十講列聯表v每格要求:處理方法:將期望值偏小的格值合并右例,做檢驗。Eij20 30 3 1nij18 29 4 2 5Eij第
6、十講列聯表v注意: 列聯表就其檢驗內容來看是雙邊檢驗,但從形式上看,卻又很像單邊檢驗。其判斷的內容僅是變量間似乎否存在關系。至于方向,由于列聯表屬定類變量,因此是不存在的。第十講列聯表列聯表檢驗步驟v1、v2、統計量:v v3、v4、比較H0H1riiEEnxii12212rx第十講列聯表例:以下是老、中、青三代對某影片的抽樣,能否認為三代人對該影片評價有顯著差異老中青很高453921一般472622第十講列聯表第三節 列聯強度v一、變量間的相關v1、列聯表中的頻次分布情況,不僅是檢驗是否存在關系的依據,同時也是度量變量間關系強弱的依據。相關性程度越高,說明社會現象與社會現象間的關系愈密切。v
7、2、列聯表中變量間的關系的強度分析,可以將頻次轉化為條件分布,然后比較自變量取不同值時,因變量條件分布的不同。第十講列聯表例v右表中,男生上網玩游戲的比例高于女生;而上網聊天的比例低于女生;v想一想,當x取值大于2時,怎樣比較?y x男生 女生玩游戲聊天40 67% 10 25%30 33% 30 75%第十講列聯表二、22表 系數和系數v列聯表中兩個變量都只有二種取值時,就是22表v當變量間無關系時(獨立)v對于22表,無論 系數或系數,都以差值 為基礎進行討論,同時,也把關系強度的取值范圍定義在 之間。 y x a b c d x1x2y1y2dbbcaabcad bcad 11 ,第十講
8、列聯表v1、 系數v 當兩變量相互獨立v b、c為零, 值最大1v a、d為零, 值最小-1v 一般情況v前例中計算dbcadcbabcad011第十講列聯表v2、系數v當a、b、c、d中有一個是零時,則v對應的實際情況是配對樣本研究v例v3、 、系數的選擇v當自變量的不同取值都會影響因變量時,用 系數。當存在控制組時,用系數bcadbc-adQ1Q 第十講列聯表v新政策頒發前后出勤狀況新政策前 新政策后正點遲到50 10050 0第十講列聯表4、 列聯表v1)以 值為基礎的相關性測量v期望頻次 是基于無相關前提下計量出來的,因 愈大,表示變量間距離無相關性愈遠。v 值構成 系數v其與22表中
9、 系數是一致,22表中是 表中 系數的特例。crx2x2x2EEnxijijij22Eijnx2cr第十講列聯表v由于 表的數增多后, 值增加,沒有上限,無法比較,因此以c系數修正。 vc值 在0,1但永遠小于1,又出現了v系數:vV 的取值:crncxx22 1,1min2crV1Vo第十講列聯表v例:已知 c=2 r=4 求 系數,c系數,v系數再例:32.192x第十講列聯表練習v習題三、四。第十講列聯表2)以減少誤差比例為基礎的相關性測量vPRE不受變量層次的限制,通過現象之間的關系研究,從一個現象預測另一個現象。v :不知y與x有關系時,預測y的全部誤差v :知道y與x有關系后,用x
10、去預測y的全部誤 差v 表示所減少的相對誤差,越大表示y與x關系越密切。EEEPRE121E1E2EEE221第十講列聯表vPRE的取值范圍:vPRE=0:兩變量是無相關(知道x 與否無助于y的預測, 誤差不變)vPRE=1:兩變量是全相關(知道x與y有關系后,可以消除預測的全部誤差)v0 PRE 1:其他v :不知y與x 有關,用y的邊緣和 的最大值去猜y值,猜中的頻次會更多。全部誤差為:v :知道有關后,先看它屬于x的哪一類,然后用這一類的眾值去猜y值,誤差為E1E2EE21cijnn1imaxnjnmaxj*n第十講列聯表兩種系數:v1) 系數v即:v 的取值范圍:vx與y無相關: ;x
11、與y全相關: nnnEEEjjciijn*1121maxmaxmax邊緣和中最高頻次觀察總數邊緣和中最高頻次每列最高頻次之和yy10第十講列聯表v例:上網愛好與性別(100人)男女聊天103040游戲4020605050100025. 0a 第十講列聯表 值的非對稱性:v1)以x為自變量,用對y的預測來定義PRE,所得 值稱作v2)以y為自變量,用對x的預測來定義PRE,所得 值稱作v3)如果x和y孰因孰果不明顯的情況,這時可同時計算 和 ,并取其平均 值,作為x和y間的相關程度。yDNyyyxDNxxyyxDDNNDDDDDDxyxyxxyxyxyy第十講列聯表 系數:v對 和 的定義比 系
12、數又有修正:v當不知道x與y有關系預測y時,充分考慮到y值邊緣分布所提供的信息。v 的取值范圍:vx與y無相關: (邊緣分布與條件分布相同)vx與y全相關: (各行、各列均只有一個不為0的頻次)E1E2rjjrjjcirjiijnnnnEEEnnn12*12*11*21211101第十講列聯表以前例為參照的推導:1、不知x與y有關:猜游戲與聊天:用邊緣分布:40%,60%隨機指派40人,猜對游戲的人數4040/100=16猜錯的人數40-4040/100=40(1-40/100)=24同理:隨機指派60人,猜對聊天的人數6060/100=36猜錯的人數60-6060/100=60(1-60/100)=24第十講列聯表vE1即為猜錯人數之和。v推廣:r1jj*2r*2*2*1*1*1nn1n(n)nn1 (n)nn1 (nE第十講列聯表v知道x與y有關后:用y的條件分布來猜y值當x=男生時隨機10人,猜對聊天的人數:1010/50猜錯的人數:10-1010/50隨機40人,猜對游戲的人數:4040/50猜錯的人數:40-4040/50猜錯二者相加:=(10-1010/50)+(40-4040/50) =50-1/50 (102 +402 )同理:當x=女生時?第十講列聯表v
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025正規的公寓式商品房租賃合同樣本
- 皮脂腺異位醫學科普
- 生命支持類設備管理
- 班級布置專項培訓方案
- 透析患者水分控制的管理
- 房地產電商營銷模式研究報告(專業版)
- 2025年通勤駕駛員安全培訓試題
- 第二課時:數字的變化規律教學設計
- 認識新質生產力
- 物理化學電子教案-第十一章
- 安徽工貿職業技術學院輔導員考試題庫
- 光伏系統調試方案
- 廣東省珠海市電工等級低壓電工作業
- 【國開】2023年春《互換性與技術測量》形考任務一二三四參考答案
- 徠卡v lux4中文說明書大約工作時間和可拍攝圖像數量
- 英語演講知到章節答案智慧樹2023年哈爾濱工程大學
- 危險化學品(柴油)儲運安全管理考試試題及答案
- 2023年下半年軟件設計師上午真題及參考答案
- 中華優秀傳統文化智慧樹知到答案章節測試2023年青島黃海學院
- 2020年廣東省中小學生 天文知識競賽試題(低年組)
- GB/T 28730-2012固體生物質燃料樣品制備方法
評論
0/150
提交評論