




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七章相關分析一、相關的意義二、積差相關三、等級相關四、質與量相關五、品質相關偏相關一、相關的意義1、相關的概念2、相關系數
相關的概念兩變量之間不精確、不穩定的變化關系稱為相關關系。它與函數關系的區別就在于兩個變量值不是一一對應得那樣精確、穩定。
兩個變量之間的變化關系,既表現在變化方向上,又表現在密切程度上。從變化方向來看,兩個變量間有以下幾種關系:(1)正相關:兩個變量的變化方向一致,即一個變量值變大時,另一個變量也隨之變大;反之,亦然。(2)負相關:兩個變量的變化方向相反,即一個變量值變大時,另一個變量值隨之變小;反之,亦然。(3)零相關:兩個變量值變化方向無一定規律,即一個變量值變大時,另一個變量做無規律的變化。返回關于散點圖如果觀察所獲得的資料是兩個變量的成對數據,那么每一對觀察值都可以用直角坐標系中的一個點(x,y)來表示,n個對象的觀察結果就可以用n個散點來表示。這就是描繪雙變量分布狀況的散點圖。散點圖(一)身高(厘米)145143150156148160154141155148150158智商(分)1001109012010010511098102908998散點圖(二)成績(分)859075908485807580756468智商(分)1001109012010010511098102908998畫散點圖X45678Y14356X45678Y35421X12345Y12345X12345Y54321X1.51.82.82.83.5Y231.542.8相關系數用來描述兩個變量相互之間變化方向及密切程度的數字特征量稱為相關系數。一般,樣本相關系數用r表示。相關系數的取值范圍是在-1到+1之間,-1≤r≤1。“+”“-”號表示變化方向。“+”表示變化方向一致,即正相關。“-”表示變化方向相反,即負相關。r的絕對值表示兩個變量之間的密切程度(即強度)。注意:1.相關系數僅僅是一個比值。它不是由相等單位度量而來的,不等距,也不是百分比,因此,不能直接作加、減、乘、除運算。2.相關系數只能描述兩個變量之間的變化方向及密切程度,并不能揭示兩者之間的內在本質聯系。3.存在相關的兩個變量,也不一定存在因果關系。二、積差相關1、積差相關的概念2、積差相關的使用條件3、積差相關系數的公式4、總體相關系數的區間估計5、相關的顯著性檢驗6、相關系數差異的顯著性檢驗返回積差相關的概念當兩個變量都是正態連續變量,而且兩者之間呈線性關系時,表示這兩個變量之間的相關稱為積差相關。返回積差相關系數的公式返回例計算相關系數X45678Y14356X45678Y35421X12345Y12345X12345Y54321X1.51.82.82.83.5Y231.542.80.904-0.71-10.196積差相關的使用條件1、兩個變量都是由測量獲得的連續性數據。2、兩個變量的總體都呈正態分布,或接近正態分布,至少是單峰對稱分布。3、必須是成對的數據,而且每對數據之間相互獨立,即每對分數與其他對子沒有關系,相互獨立。4、兩個變量之間呈線形關系。這可由散點圖來做初步分析。5、要排除共變因素的影響。6、樣本容量要≥30,計算出的積差相關系數才具有有效意義。例返回偏相關偏相關(partialcorrelation),也稱純相關或凈相關,指在計算兩個連續變量X1與X2的相關時,將第三個變量X3或其他多個變量的影響,即r13和r23予以排除之后,X1與X2這兩個變量之間的純凈相關,用符號r12.3表示,點號左邊的兩個下標代表要求計算偏相關的兩個變量,點號右邊的下標表示要消除其影響的變量。偏相關的公式如下:偏相關之例一
(將學歷XL作為控制變量,對兒童智商IQ與母親年齡NL作偏相關分析)對12名兒童的智商IQ、出生時母親的年齡NL,以及母親的文化程度(接受正規教育的年限——學齡)XL這三個變量進行調查的結果如下表:abcdefghijklIQ788294959697102105106108114122NL202122252726282730323232XL699121212151616191922r=0.934r12.3=0.0887偏相關系數的“階數”一階偏相關系數——只控制了一個“第三變量”;二階偏相關系數——控制了兩個“第三變量”;。。。。。。控制變量可以不止一個,而控制變量的數目就是偏相關系數的階數。不難理解,兩列變量之間的簡單相關系數是零階的“偏相關系數”,也就是說,它是在沒有控制任何條件的情況下考察兩種現象之間的相互聯系。偏相關分析作為一種統計分析的手段,可以幫助我們“透過現象看本質”,更加深入地把握事物之間相互聯系的證據。偏相關分析既可以幫助我們辨別虛假的“偽相關”,也可以幫助我們發現被掩蔽了的“真相關”。偏相關分析之例二
(將工齡GL作為控制變量,對工資GZ與學歷XL作偏相關分析。)abcdefghijklGZ800900100020001500220027003000280035001500950GL2141010201021202514XL161916161212191616162212r=0.038(p>0.05)r13.2=0.8177(p<0.01)練習下表是20名學生某次期末考試的語文、數學、外語三門課的成績,試求剔除了語文成績之后,20名學生的數學成績與外語成績的偏相關系數。編號1234567891011121314151617181920語文9188837084927887827766697493868477738971數學8592866687887481917862717790948273698883外語9392816484917280857364676288847861748562語文與數學:0.827語文與外語:0.900數學與外語:0.787積差相關例題成績(分)859075908485807580756468智商(分)1001109012010010511098102908998總體相關系數的區間估計1、樣本相關系數的抽樣分布只有當總體相關系數ρ=0時,樣本相關系數的抽樣分布才接近正態(嚴格來說,ρ=0時樣本相關系數r的分布為t分布)。當總體相關系數ρ≠0時,樣本相關系數的抽樣分布呈偏態,概率分布函數較為復雜。將相關系數做轉換:
那么無論總體相關系數ρ是否等于零,樣本Z的抽樣分布都近似地服從于正態分布。Zr的標準誤是:
2、置信區間的確定:return相關的顯著性檢驗之一:H0:ρ=0的檢驗如前所述,當總體相關系數ρ=0時,樣本相關系數r的抽樣分布為t分布。此時樣本相關系數標準誤的估計值是
檢驗統計量為:自由度:n-2。在實際應用中,通常是直接查積差相關系數顯著性臨界值表來斷定r是否顯著。例:例:12名初二學生的智商與身高情況登記如下表。能否認為學生的智商確實與身高有關(身材矮小者較聰明或者相反)?身高(厘米)145143150156148160154141155148150158智商(分)1001109012010010511098102908998相關的顯著性檢驗之二:H0:ρ=ρ0的檢驗虛無假設意指:在總體中兩個變量之間存在某種程度的線性相關,而樣本的相關系數r≠ρ0是由于抽樣的偶然誤差。
檢驗統計量為:例:例據稱EPT與TOFEL兩種測驗的相關高達0.80。隨機抽取的40名被試,兩個測驗成績的相關系數r=0.75,據此能不能否定總體ρ=0.80?解:查表:r=0.75時,Zr=0.973
ρ=0.80時,Zρ=1.099
Return相關系數差異的顯著性檢驗(一)1、獨立樣本(r1和r2分別由彼此獨立的被試得到)之間樣本相關系數差異的顯著性檢驗例:從某省隨機抽取的103名高考考生中,男56人,女47人。男生數、理兩科成績的相關系數r1=0.83,女生數、理兩科成績的相關系數r2=0.76。數、理兩科成績的相互關系是否存在顯著的性別差異?解:相關系數差異的顯著性檢驗(二)2、同組被試兩個相關系數差異的顯著性檢驗這里只介紹同組被試的三個測驗,兩兩相關系數之差的顯著性檢驗。檢驗的虛無假設是:H0:ρ12=ρ13,檢驗統計量為:檢驗統計量t的自由度df=n-3。例:以某一權威測驗X1為效標考查新編制的兩套外語測驗X2、X3的有效性。在容量n=303的標準化樣本中,求得三個測驗的兩兩相關系數分別是:r12=0.62;r13=0.51;r23=0.70。新編制的兩個測驗的效度是否有顯著的差別?解:return三、等級相關1、斯皮爾曼等級相關2、肯德爾和諧系數返回斯皮爾曼等級相關1、概念及適用范圍當兩個變量值以等級次序排列或以等級次序表示時,兩個相應總體并不一定呈正態分布,樣本容量也不一定大于30,表示這兩個變量之間的相關,稱為等級相關。2、相關系數的計算等級相關系數的顯著性檢驗方法與積差相關的相同。例例成績(分)859075908485807580756468智商(分)1001109012010010511098102908998成績等級3.51.591.553.56.596.591211智商等級6.52.510.516.542.58.5510.5128.5D-3-1-1.50.5-1.5-0.54.00.51.5-1.502.5D2912.250.252.250.25160.252.252.2506.25return成績(分)859075908485807580756468智商(分)1001109012010010511098102908998肯德爾和諧系數1、概念及使用范圍
當多個(兩個以上)變量值以等級次序排列或以等級次序表示,描述這幾個變量之間一致性程度(即相關)的量,稱為肯德爾和諧系數。它常用來表示幾個評定者對同一組學生學習成績等級評定的一致性程度或同一個評定者對同一組學生的學習成績用等級先后評定多次之間的一致性程度。2、相關系數的計算例例N=7趙錢孫李周(k=5)RiRi2蕭亞軒1111111周杰倫1111111S.H.E1111111蔡依琳1111111陳奕迅1111111潘瑋柏1111111王菲1111111返四、質與量相關1、點二列相關2、二列相關返回點二列相關1、概念及適用范圍
當兩個變量其中一個是正態連續性變量,另一個是真正的二分名義變量時,表示這兩個變量之間的相關,稱為點二列相關。2、相關系數的計算例例14名男女學生某項技能測驗的成績如下表,試計算該技能測驗成績與性別的相關系數.男1女011111111000000總和成績X7968354628643677接二列相關應用點二列相關的應用
——用于對測驗項目的區分度進行檢驗。有一是非式選擇測驗,每題選對得2分,共有50題,滿分100分。下表所列為20名學生在該測驗中的總成績及第5題的選答情況。問這道題與測驗總分的相關程度如何?學號總分第5題學號總分第5題184對282錯376錯460錯572錯674錯776錯884對988對1090對1178對1280錯1392對1494對1596對1688對1790對1878錯1976錯2074錯點二列相關與二列相關相同之處:都可用于計算題目的區分度。區別:適用數據不同。點二列相關中的二分變量是真正的二分變量,不是正態分布的;二列相關中的二分變量是由正態分布的連續性測量數據人為轉化來的。使用點二列相關和二列相關的總原則:如果不是十分明確觀測數據的分布形態是否為正態分布,這時,不管觀測數據代表的是一個真正的二分變量,還是一個基于正態分布的人為二分變量,都應選用點二列相關。只要有任何疑問,選用點二列相關總是較好的選擇。在實際的研究當中,二列相關很少使用。偏相關練習練習問下表中成績與性別是否有關?被試12345678910性別男女女男女男男男女女成績83919584898786858892二列相關1、概念及適用范圍當兩個變量都是正態連續變量,其中一個變量被人為地劃分成二分變量,表示這兩個變量之間的相關,稱為二列相關。2、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 藻類與植物協同作用下的碳捕集技術研究-洞察闡釋
- 能源回收型污水處理工藝研究-洞察闡釋
- 基于實體識別的港口數據語義提取-洞察闡釋
- 智能化醫療垃圾處置設備-洞察闡釋
- 低氧血癥患者心力衰竭的藥效學研究-洞察闡釋
- 罐頭食品中多效分離技術與儲藏環境適應性研究-洞察闡釋
- 數字營銷與零售業增長的關系-洞察闡釋
- 硬件事務內存與存儲層次結構的協同優化研究-洞察闡釋
- 城市綠化車隊出碴作業合同
- 深海礦產資源采礦權出讓與海洋環境保護合同
- 中國公民普通護照申請表(正面)
- 人工智能與房地產營銷
- LKJ系統車載設備換裝作業指導書
- 【小米公司戰略成本管理分析6500字(論文)】
- 《農村電商運營》農產品電商運營方案
- 區塊鏈在金融領域的應用課件
- VDA6.3-2016過程審核對應的資料
- 采用新技術、新工藝、新材料、新設備的安全管理措施
- 《藝術概論》章節測試及答案
- 青島科技大學Python程序設計期末復習題
- 開曼群島公司章程
評論
0/150
提交評論