相關分析(完整)_第1頁
相關分析(完整)_第2頁
相關分析(完整)_第3頁
相關分析(完整)_第4頁
相關分析(完整)_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1相關分析過程 2概念相關分析偏相關分析品質相關3相關分析的概念4確定性關系與非確定性關系區別:確定型關系:是通常的函數關系,如圓的面積與半徑之間的關系:S= r2不確定型關系:例如,人的身高與體重之間的關系。變量之間的相關關系有兩種:確定型關系和不確定型關系。相關分析是研究變量之間不確定關系的統計方法。5相關關系的統計學分類因果關系、共變關系單相關和復相關直線相關和曲線相關正相關、負相關、零相關完全相關、完全不相關、不完全相關本講研究范圍:不確定性的線性相關關系公共管理定量分析:公共管理定量分析: 方法與技術方法與技術,袁政,袁政,p62p626公共管理定量分析:公共管理定量分析: 方法與技

2、術方法與技術,袁政,袁政,p76;另外參考張厚粲和徐建平,;另外參考張厚粲和徐建平,2009,p150 7相關系數不能相除,不能說前者是后者的幾倍相關系數值的大小表明兩列數據相互間的相關程度。相關系數為-0.6和0.6,強度一致,只是方向不同。目的:用一個變量去預測另一個變量的值89皮爾遜(pearson)相關系數皮爾遜(pearson)相關系數,是一般常見的線性相關系數,一般用R表示:變量Y和X之間線性相關的程度。R在(0,1)之間為正相關;在(-1,0)之間為負相關;等于1為完全正相關;-1為完全負相關;0為不相關。又稱:積差相關、積矩相關(product-moment coefficie

3、nt of correlation)計算公式為:10皮爾遜(pearson)相關系數21211niiniiiniiXYYYXXYYXXR11積差相關的適用條件成對數據兩個變量的總體都符合正態分布:取大樣本進行正態分布非參數檢驗兩個變量都是連續變量(scale)兩列變量之間的關系是直線性的:散點圖+文獻張厚粲和徐建平,2009,p11212Effect size of Pearsons rCohen, J (1992). A power primer. Psychological Bulletin 112112 (1): 155159. 請雙擊以打開圖標:13皮爾遜相關系數的顯著性檢驗舉例:14

4、個學生英語考試成績與每個學生掌握的單詞量的相關系數是0.98,檢驗其顯著性?選擇 =0.05,根據自由度df=14-2=12,查找t分布表得:t0.05/2=2.1788。結論:因為t=17.2792 t0.05/2=2.1788,表明線性相關系數是顯著的。2 122ntrnrt2792.1798. 0121498. 02t14散點圖相關系數為0,即零相關,但不能立即判定兩個變量沒有關系1516例子:馬慶國CH8CH9CH10投資額與依據17簡單相關分析:修改運行語句F注意WITH前后有空格FA B with C D,只計算A和C、D之間和B和C、D之間的相關例子:馬慶國CH8CH9CH10投

5、資額與依據18斯皮爾曼(spearman)相關系數對數據分布形態不作要求適用于定序或以上度量尺度例子:10名學生的數學和語文成績,計算其相關系數19斯皮爾曼(spearman)相關系數斯皮爾曼(spearman)相關系數,用于反映兩個定序或等級變量的相關程度。計算時要首先對變量值求秩。對兩個配對測量的變量X和Y的測度值在各自序列中求秩后,斯皮爾曼相關系數的計算公式與皮爾遜相關系數公式相同。兩個定距度量尺度的變量也可以計算等級相關系數,但精確度不如積差相關系數(張厚粲和徐建平,2009,p. 122)。故二者只報告一個。20斯皮爾曼(spearman)相關系數公式21二元變量的相關過程執行命令:

6、F Analyze correlatebivariate (二元變量)F 打開對話框;F 選擇兩個變量或更多的變量;F Correlation coefficient欄中3個復選項Pearson:連續變量Kendalls tau-b:兩個等級變量或類型變量Spearman :兩個等級變量或類型變量(系統將會自動對變量值求秩)F Test of significanceTwo-tailedOne-tailedF Flags significant correlations:加星號22二元變量的相關過程單擊options按鈕F Statistics欄中的選項只當在主對話框選擇pearson相關系數

7、時才會被激活:Mean and standard deviationsCross-product deviations and covariances:叉積離差陣和協方差陣F Missing values:Exclude cases pairwise:成對剔除參與計算的具有缺失值的觀測量Exclude cases listwise:剔除具有缺失值的所有觀測量23馬慶國例子同前24練習馬慶國:CH9數學語文成績25練習積差相關:藍石10.1節;等級相關:張奇,data6-02;藍石10.2節;26偏相關系數(partial correlations)偏相關系數:它描述的是當控制了一個或幾個附加變

8、量的影響時兩個變量的相關性。例如可以控制工齡的影響,來研究工資收入與受教育程度之間的相關關系。工資教育工齡簡單相關系數偏相關系數27偏相關分析的概念相關分析通過計算兩個變量之間的相關系數,分析變量間線性相關的程度。在多元相關分析中,由于受到其他變量的影響,pearson相關系數只是從表面上反映兩個變量相關的性質,往往不能真實地反映變量之間的線性相關程度,甚至會給人造成相關的假象。因此,在某些場合中,簡單的pearson相關系數并不是刻畫相關關系的本質統計量。當其他變量被固定住,即將它們控制起來后,給定的任意兩個變量之間的相關系數叫偏相關系數。偏相關系數才是真正反映兩個變量相關關系的統計量。28

9、29二元變量的偏相關過程執行命令:Analyze correlatepartial correlations (偏變量),打開對話框;F 選擇兩個變量或更多的變量;F 選擇至少一個控制變量移入控制變量欄;F Test of significanceTwo-tailedOne-tailedF Display actual significance level:加星號30二元變量的偏相關過程單擊options按鈕F Statistics欄中的選項Mean and standard deviationsZero-order correlations:零階相關系數陣,即pearson 相關系數矩陣;F

10、 Missing values:Exclude cases pairwise:成對剔除參與計算的具有缺失值的觀測量Exclude cases listwise:剔除具有缺失值的所有觀測量31馬慶國:CH9偏相關商客旅相關性相關性控制變量商業投資萬元地區經濟增長游客增長%-無-a 商業投資萬元相關性1.000.644.791顯著性(雙側).000.000df02424地區經濟增長相關性.6441.000.773顯著性(雙側).000.000df24024游客增長% 相關性.791.7731.000顯著性(雙側).000.000.df24240游客增長%商業投資萬元相關性1.000.083顯著性(

11、雙側).695df023地區經濟增長相關性.0831.000顯著性(雙側).695.df230a. 單元格包含零階 (Pearson) 相關。32虛假相關(spurious correlation)控制了第三個變量后,兩個變量之間本來存在的相關關系不存在了。例子:F鞋子大小與言語能力F數學成績與語文成績F8-13歲兒童的握力和數學成績F個人收入與大學階段的成功F張厚粲和徐建平,2009,pp148-93334練習偏相關:張奇,data6-03;3536品質相關計數數據二維度列聯表373839馬慶國書,pp.258-260404142Yete校正:對22列聯表進行卡方檢驗,單元格的期望次數低于1

12、0但是大于5時,要用Yete連續性校正一行的結果;Fisher精確概率檢驗法:對22列聯表進行卡方檢驗,當某個單元格內期望次數低于5,或者樣本總人數低于20時, 用本行結果。參考:張厚粲和徐建平,2009,p296;馬慶國,2002,p. 26043對于非四格表,當期望頻數小于5的格子小于20%,用Pearson卡方一行的結果。否則,用似然比一行的結果。以上是關于讀取哪一行的結果的指南。至于讀取哪一列的結果,可以按下面的指南來判斷:如果期望頻數小于5的格子多于20%,就不能使用ASYMP.sig的結果。此時,應該在SPSS卡方檢驗中選擇使用Exact Test(確切概率法),以Exact Te

13、st的結果為準(軟件也同時顯示ASYMP.sig的結果)http:/ (張厚粲和徐建平,2009,p. 296)如:抽樣的隨機性、樣本比例、問卷引導語等例子:支持vs不支持45PHI系數和Cramers V適用于:兩個變量都是定名或者二分變量。22:用PHI(真正的二分變量);更多分類,則用Cramers V(藍石,2011,p. 180)PHI系數:張厚粲和徐建平,2009,pp143-5藍石例子:附錄KSPSS步驟:分析-描述統計-交叉表和品質相關/卡方檢驗的關系:PHI和Cramers V的輸出結果中,給出了相關系數,公式參見張厚粲和徐建平,2009,p143。同時給出顯著性概率。這里的顯著性概率就是通過卡方檢驗來計算得出的。也就是說,卡方檢驗可以分析兩個定名變量是否顯著相關,而PHI和Cramers V則能給出相關系數。另參考張厚粲和徐建平,2009,p. 145頁最上方例子46品質相關的論文實例納迪,2009。如何解讀統計圖表:研究報告閱讀指南,pp60-814748質量相關定名變量和定距變量的相關點二列相關:張厚粲和徐建平,2009,pp134-137藍

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論