第5章相關(guān)關(guān)系ppt課件_第1頁(yè)
第5章相關(guān)關(guān)系ppt課件_第2頁(yè)
第5章相關(guān)關(guān)系ppt課件_第3頁(yè)
第5章相關(guān)關(guān)系ppt課件_第4頁(yè)
第5章相關(guān)關(guān)系ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 相關(guān)關(guān)系第五章 相關(guān)關(guān)系 問題? 經(jīng)過前面的學(xué)習(xí),我們知道,給定任何一列單變量延續(xù)數(shù)據(jù),都可以用平均數(shù)和規(guī)范差反映數(shù)據(jù)的總體特征。 然而在實(shí)踐的心思和教育丈量中,往往會(huì)遇到兩種事物,兩種景象關(guān)系的描畫,此時(shí)我們又如何去統(tǒng)計(jì)處置呢? 對(duì)于雙變量數(shù)據(jù)相互之間的關(guān)系可以用相關(guān)系數(shù)加以統(tǒng)計(jì)分析。 何謂雙變量?體。所推斷的是雙變量的總相對(duì)應(yīng):同時(shí)有另外的一個(gè)變量的每一個(gè)觀測(cè)值:對(duì)于一個(gè)變量nnYYYYXXXX,2121 主要內(nèi)容 第一節(jié):相關(guān)、相關(guān)系數(shù)與散點(diǎn)圖 第二節(jié):積差相關(guān) 第三節(jié):等級(jí)相關(guān) 第四節(jié):質(zhì)與量的相關(guān)略 第五節(jié):質(zhì)量相關(guān)略 第六節(jié):相關(guān)系數(shù)的選用與解釋第一節(jié) 相關(guān)、相關(guān)系數(shù)與散點(diǎn)

2、圖一、什么是相關(guān)一事物之間的相互關(guān)系有三種:1.因果關(guān)系:一種景象是另一種景象的緣由2.共變關(guān)系:外表上有聯(lián)絡(luò)的兩種事物其實(shí) 都和第三種景象有關(guān)3.相關(guān)關(guān)系:兩類景象在開展變化的方向和 大小方面存在一定聯(lián)絡(luò),但并 不是前兩種關(guān)系,比較復(fù)雜 一、什么是相關(guān) 二相關(guān)的類別三種 1.正相關(guān):兩列變量變動(dòng)方向一樣 2.負(fù)相關(guān):兩列變量變動(dòng)方向相反 3.零相關(guān):兩列變量之間沒有相關(guān) 關(guān)系存在二、相關(guān)系數(shù)coefficient of correlation 相關(guān)系數(shù)是兩列變量間相關(guān)程度的數(shù)字表現(xiàn)方式。作為樣本間相互關(guān)系程度的統(tǒng)計(jì)特征數(shù),常用r表示,作為總體參數(shù),普通用表示, 是運(yùn)用比較廣泛的一個(gè)有代表性的

3、統(tǒng)計(jì)量。 相關(guān)系數(shù)是就線形關(guān)系而言的相關(guān)系數(shù)的取值 內(nèi)在涵義: 1.取值范圍:位于-1.00至+1.00之間,是一個(gè)比率,常用 小數(shù)方式表示 2.取值大小:表示雙變量相關(guān)的強(qiáng)度 r1,那么相關(guān)越親密 r0,相關(guān)越不親密 3.正負(fù)號(hào):表示雙變量相關(guān)的方向 是正相關(guān)+還是負(fù)相關(guān)- 4.代表值:r+1,表完全正相關(guān) r-1,表完全負(fù)相關(guān) r0,表無(wú)相關(guān)11r留意: 普通情況下,經(jīng)過相關(guān)系數(shù)r的值來(lái)判別雙變量相關(guān)能否親密時(shí),要把樣本量的大小和相關(guān)系數(shù)取值大小綜合起來(lái)思索,經(jīng)統(tǒng)計(jì)檢驗(yàn)后方能確定變量之間能否存在顯著相關(guān) 兩變量間不是線形關(guān)系時(shí),不能用直線相關(guān)計(jì)算r值三、散點(diǎn)圖 在相關(guān)研討中,常用相關(guān)散點(diǎn)圖

4、表示兩個(gè)變量之間的關(guān)系;散點(diǎn)圖經(jīng)過點(diǎn)的分布外形和疏密程度來(lái)顯示兩個(gè)變量的相關(guān)趨勢(shì)和相關(guān)程度。第二節(jié) 積差相關(guān)一、積差相關(guān)的概念與適用資料一概念當(dāng)兩個(gè)變量都是正態(tài)、延續(xù)變量,而且二者之間呈線形關(guān)系,表示這兩個(gè)變量之間的相關(guān)為積差相關(guān)由英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜在20世紀(jì)初提出,簡(jiǎn)稱:Pearson相關(guān)系數(shù)軟件中常用此稱號(hào)積差相關(guān)又稱為積距相關(guān)離均差乘方之和除以N稱做“矩(moment),把X的離均差和Y的離均差兩者積的總和除以N,用“積矩表示。稱為協(xié)方差covariance,X和Y有協(xié)同變化的規(guī)律。計(jì)算協(xié)方差的根本方法NxyCOV 二適用條件1.要求成對(duì)數(shù)據(jù),且每對(duì)數(shù)據(jù)之間是相互 獨(dú)立的2.樣本容量n=

5、303.兩列變量都是延續(xù)變量4.兩列變量總體分布為正態(tài)或接近正態(tài), 至少是單峰對(duì)稱分布5.兩列變量之間的關(guān)系是直線型的,可由 相關(guān)散點(diǎn)圖的外形粗略判別二、計(jì)算積差相關(guān)系數(shù)的根本公式一利用規(guī)范差和離均差的計(jì)算公式:一利用規(guī)范差和離均差的計(jì)算公式:(5-1a)(5-1b)newYXYXSSSxyryxxyrSNSxyr22.NxyCOV 二運(yùn)用規(guī)范分?jǐn)?shù)計(jì)算相關(guān)系數(shù)的公式 協(xié)方差 中的xy的大小可以反映兩列變量的一致性 計(jì)算公式:YXZZNr1(5-2)三原始觀測(cè)值計(jì)算公式 22222222)()(YYNXXNYXXYNrNYYNXXNYXXYr(5-3a)(5-3b) 解:根據(jù)已有資料可知,此兩列

6、變量分布都為正解:根據(jù)已有資料可知,此兩列變量分布都為正態(tài),且身高、體重都屬丈量數(shù)據(jù)并為線性相關(guān),態(tài),且身高、體重都屬丈量數(shù)據(jù)并為線性相關(guān),所以經(jīng)過積差相關(guān)計(jì)算相關(guān)系數(shù)所以經(jīng)過積差相關(guān)計(jì)算相關(guān)系數(shù) 代入三個(gè)公式可得:代入三個(gè)公式可得:三、計(jì)算積差相關(guān)系數(shù)的差法公式 利用離均差x、y相加或相減的方法,求積差相關(guān)系數(shù)的方法22222222222222222)(22)(2yxyxyxrsssssryxyxyxrsssssrYXYXyxYXYXYX(二)加差法(一)減差法 公式5-4a公式5-4b公式5-5a公式5-5b四、相關(guān)系數(shù)的合并略 在心思和教育研討中,通常會(huì)需求求同一個(gè)總體的幾個(gè)樣本的相關(guān)系

7、數(shù)的合成,即平均相關(guān)系數(shù),此時(shí)可用Zr轉(zhuǎn)換法 步驟: 1.查表8,將各樣本的r轉(zhuǎn)換成費(fèi)舍Z分?jǐn)?shù) 2.求每一樣本的Z分?jǐn)?shù)之和 3.求平均Z分?jǐn)?shù),即 4.再查附表8,將 轉(zhuǎn)換成相應(yīng)的r值)3()3(iiinZnZZ第三節(jié) 等級(jí)相關(guān)所得到資料是等級(jí)順序,其總體不是正態(tài)分布的條件下,但是線性相關(guān)。一、斯皮爾曼Spearman等級(jí)相關(guān)適用條件適用于兩列變量,而且是屬于等級(jí)變量性質(zhì)具有線性關(guān)系的資料,主要用于處理類別數(shù)據(jù)和順序數(shù)據(jù)的資料,不思索資料能否正態(tài),且不要求n30。留意:符合Pearson積差相關(guān)的數(shù)據(jù)不要用等級(jí)相關(guān)計(jì)算計(jì)算公式) 1(6130. 122NNDrNR)等級(jí)差數(shù)法() 1() 1(4

8、13. 2NNNRRNrYXR等級(jí)序數(shù)法5-7b5-7a 當(dāng)?shù)燃?jí)變量中沒有一樣等級(jí)時(shí),可以直接運(yùn)用上述兩個(gè)公式進(jìn)展計(jì)算 步驟: 1賦予等級(jí)。分別將兩個(gè)變量的成果從優(yōu)到劣賦予等級(jí),最優(yōu)者賦予1,最劣者賦予n,或采用相反的方式排序,但兩變量排序方式要一致 2計(jì)算D值與D平方的值或RxRy值 3代入公式運(yùn)算 3.有一樣等級(jí)時(shí)計(jì)算等級(jí)相關(guān)的方法 當(dāng)?shù)燃?jí)變量中有一樣等級(jí)時(shí), 會(huì)隨著等級(jí)數(shù)目的增多而有規(guī)律的減少,而不論是哪個(gè)等級(jí)序數(shù);此時(shí)應(yīng)參與校正數(shù)C 計(jì)算公式:2R12)1(2nnC為各列變量相同等級(jí)數(shù)為成對(duì)數(shù)據(jù)的數(shù)目,其中:n12)1(1212)1(12223223222222NnnCCNNynnCC

9、NNxyxDyxryyxxRC公式5-9【例5-4】表5-9是10名學(xué)生的數(shù)學(xué)和語(yǔ)文考試成果,問數(shù)學(xué)與語(yǔ)文成果能否相關(guān)例5-5 有12名學(xué)生的兩門功課成果評(píng)定分?jǐn)?shù),見表5-10。問該兩門功課成果能否具有一致性?二、肯德爾等級(jí)相關(guān)略二、肯德爾等級(jí)相關(guān)略一肯德爾一肯德爾W W系數(shù)系數(shù)肯德爾調(diào)和系數(shù)肯德爾調(diào)和系數(shù)(Kendall coefficient of (Kendall coefficient of concordance), concordance), 是表示多列等級(jí)變量相關(guān)是表示多列等級(jí)變量相關(guān)程度的一種方法程度的一種方法 , , 適用于兩列以上的等級(jí)適用于兩列以上的等級(jí)變量。肯德爾調(diào)和系

10、數(shù)常用符號(hào)變量??系聽栒{(diào)和系數(shù)常用符號(hào) W W 表示。表示。 1.1.適用資料適用資料 經(jīng)過等級(jí)評(píng)定法獲得數(shù)據(jù)資料的兩經(jīng)過等級(jí)評(píng)定法獲得數(shù)據(jù)資料的兩種情形:種情形: 1 1K K個(gè)評(píng)定者或被試對(duì)個(gè)評(píng)定者或被試對(duì)N N件事物或件事物或 作品的等級(jí)評(píng)定作品的等級(jí)評(píng)定 2 2一個(gè)評(píng)定者或被試對(duì)一個(gè)評(píng)定者或被試對(duì)N N件事物或件事物或 作品先后進(jìn)展作品先后進(jìn)展K K次等級(jí)評(píng)定次等級(jí)評(píng)定 最終可以得到最終可以得到K K列從列從1 1至至N N的等級(jí)變的等級(jí)變量資料量資料2.計(jì)算公式10)(1)1(3)1(12)(121122222232WKNKRNRRNRRsNNNNKRWNNKsWiiiiii代表等級(jí)

11、評(píng)定者的數(shù)目數(shù)目代表等級(jí)評(píng)定的對(duì)象的個(gè)等級(jí)之和代表評(píng)價(jià)對(duì)象獲得的其中:)無(wú)相同等級(jí)出現(xiàn)((公式5-10a)(公式5-10b)【例【例5-65-6】有】有1010人對(duì)紅、橙、黃、綠、青、藍(lán)、紫人對(duì)紅、橙、黃、綠、青、藍(lán)、紫七種顏色進(jìn)展評(píng)價(jià)七種顏色進(jìn)展評(píng)價(jià), ,評(píng)價(jià)能否一致?獲得的數(shù)據(jù)見表評(píng)價(jià)能否一致?獲得的數(shù)據(jù)見表5-115-11。為相同等級(jí)數(shù)目其中:修正公式)有相同等級(jí)出現(xiàn)時(shí)用(nnnTNRRsTKNNKsWii12)(121232232公式5-11二肯德爾U系數(shù)略 1.適用資料: 與肯德爾W系數(shù)一樣,但是經(jīng)過對(duì)偶比較法獲得等級(jí)數(shù)據(jù)。 2.計(jì)算公式:1) 1() 1(82KKNNrKrUiji

12、j)(公式5-12第四節(jié) 質(zhì)與量相關(guān)略問題兩列變量中: 一列為等級(jí)或等比丈量數(shù)據(jù),且 總體分布為正態(tài) 一列為二分變量如何求其一致性程度?概念 質(zhì)與量相關(guān) 在計(jì)算相關(guān)兩列變量中,一列為等比或等距的丈量數(shù)據(jù),另一列是按性質(zhì)劃分的類別,欲求這樣兩列變量的直線相關(guān),稱之為質(zhì)量相關(guān),包括點(diǎn)二列相關(guān)、二列相關(guān)及多系列相關(guān)。 二分變量賦值為1,0 按事物的某一性質(zhì)劃分的只需兩類結(jié)果的變量 種類: 真正的二分變量:即離散型二分變量,變量本身 就只需兩類結(jié)果,如男性與女性 人為的二分變量:變量本身為延續(xù)型的丈量數(shù) 據(jù),但被人為地按照某個(gè)規(guī)范劃分為兩個(gè)類 別,如及格與不及格 另,雙峰分布的變量也可以劃分為二分稱名

13、變 量,如文盲與非文盲,就識(shí)字量而言能夠是 雙峰分布一、點(diǎn)二列相關(guān)point-biseral correlation 一適用資料 兩列變量: 一列為等級(jí)或等比丈量數(shù)據(jù),總體分布為正態(tài) 一列為真正的二分變量或雙峰分布變量,總體分布形狀未知 調(diào)查此二列變量的相關(guān)程度的統(tǒng)計(jì)方法為點(diǎn)二列相關(guān) 二計(jì)算公式00. 100. 100. 1s1qpqpt接近于,相關(guān)越高,絕對(duì)值越是連續(xù)變量的標(biāo)準(zhǔn)差各自所占的比率,是二分稱名變量?jī)蓚€(gè)值與平均數(shù)個(gè)值對(duì)應(yīng)的連續(xù)變量的是二分稱名變量的另一均數(shù)值對(duì)應(yīng)的連續(xù)變量的平是二分稱名變量的一個(gè)其中:pbqptqppbrXXpqsXXr公式5-13【例【例5-9 5-9 】有一是非

14、選擇檢驗(yàn),每題選對(duì)得】有一是非選擇檢驗(yàn),每題選對(duì)得2 2分。共分。共5050題,總分值題,總分值100100分。表分。表5-145-14是是2020名學(xué)名學(xué)生在該檢驗(yàn)中得總成果及第生在該檢驗(yàn)中得總成果及第5 5題的選答情況。題的選答情況。問該題與檢驗(yàn)總分的相關(guān)程度如何?問該題與檢驗(yàn)總分的相關(guān)程度如何?二、二列相關(guān)biseral correlation一適用資料 兩列變量: 一列為等距或等比丈量數(shù)據(jù),總體分布為正態(tài) 一列為人為劃分的二分變量,總體分布為正態(tài)留意:當(dāng)其中的人為劃分的二分變量其總體分布不能確定能否為正態(tài)時(shí),要用點(diǎn)二列相關(guān)計(jì)算二列相關(guān)與點(diǎn)二列相關(guān)的主要區(qū)別在于變量分布能否均為正態(tài)二計(jì)算

15、公式三、多列相關(guān)multiserials correlation 略 一適用資料 一列為等距或等比的丈量數(shù)據(jù),總體分布 為正態(tài) 一列為多分名義變量,總體分布為正態(tài); 如成果分為優(yōu)、良、中、差 在檢驗(yàn)中常用于效度檢驗(yàn),亦可作次數(shù)分布表求相關(guān)系數(shù)的一種方法 二計(jì)算公式,其相關(guān)程度越高接近,相關(guān)系數(shù)的絕對(duì)值越為連續(xù)變量的標(biāo)準(zhǔn)差連續(xù)變量的平均數(shù)為每一名義變量對(duì)偶的查正態(tài)表給出正態(tài)曲線高度,由為每一名義變量上限的查正態(tài)表給出正態(tài)曲線高度,由為每一名義變量下限的為每系列的次數(shù)比率其中,100. 100. 1)()(2stiiHiLiiHLtiHLsrsXpypyppyysXyyr第五節(jié)第五節(jié) 質(zhì)量相關(guān)略質(zhì)

16、量相關(guān)略當(dāng)兩列變量都按質(zhì)劃分成幾種類型,此時(shí)用質(zhì)量相當(dāng)兩列變量都按質(zhì)劃分成幾種類型,此時(shí)用質(zhì)量相關(guān)求一致性程度關(guān)求一致性程度質(zhì)量相關(guān)用于質(zhì)量相關(guān)用于R RC(C(行行列列) )表的兩個(gè)變量之間的關(guān)表的兩個(gè)變量之間的關(guān)聯(lián)程度。在編制心思檢驗(yàn)、工程分析時(shí)聯(lián)程度。在編制心思檢驗(yàn)、工程分析時(shí), , 常用的方常用的方法。質(zhì)量相關(guān)處置的數(shù)據(jù)類型普通都是計(jì)數(shù)數(shù)據(jù)。法。質(zhì)量相關(guān)處置的數(shù)據(jù)類型普通都是計(jì)數(shù)數(shù)據(jù)。質(zhì)量相關(guān)依二要素的性質(zhì)及分類工程的不同質(zhì)量相關(guān)依二要素的性質(zhì)及分類工程的不同, ,而有不而有不同的稱號(hào)和計(jì)算方法。同的稱號(hào)和計(jì)算方法。主要有四分相關(guān)、主要有四分相關(guān)、相關(guān)、列聯(lián)表相關(guān)等。相關(guān)、列聯(lián)表相關(guān)等

17、。一、四分相關(guān)一、四分相關(guān)tetrachoric correlatio 一適用資料 1.二列變量均為正態(tài)延續(xù)變量 2.二列變量均被人為地按某一規(guī)范劃分成兩個(gè)不同的類別,即人為二分變量 如把一個(gè)要素劃分為A與非A,另一要素劃分為B與非B,這樣可構(gòu)成一個(gè)四格表A和B的交叉項(xiàng)計(jì)為a,非A和非B的交叉項(xiàng)計(jì)為d非A與B的交叉項(xiàng)計(jì)為b非B與A的交叉項(xiàng)計(jì)為cNa+b+c+d 二計(jì)算公式 計(jì)算四格相關(guān)最常用的方法是皮爾遜余弦法二、二、系數(shù)略系數(shù)略 一適用資料 兩列變量均為真正的二分變量 二計(jì)算公式 值大小表兩要素間的相關(guān)程度:0.3,弱相關(guān); 0.30.6,中等相關(guān) 0.6,強(qiáng)相關(guān) ad與bc的大小決議相關(guān)方

18、向bcadbcadbcadbcadQ5-18a5-18b)()()(dcdbcbbabcadr5-17三、列聯(lián)表相關(guān) 略 一適用資料 兩個(gè)變量或其中之一被分成兩個(gè)以上的類別 二計(jì)算公式NCRTC)(11n222公式5-19公式5-20第六節(jié) 相關(guān)系數(shù)的選用與解釋 一、如何選擇適宜的相關(guān)系數(shù) 1.思索每種丈量所產(chǎn)生的數(shù)據(jù)屬于什么類別,測(cè)查被試的那種屬性 2.要對(duì)第一種丈量數(shù)據(jù)和第二種丈量數(shù)據(jù)的類型依次做出判別 3.決議采用哪種相關(guān)系數(shù) 二、相關(guān)系數(shù)值的解釋 1.相關(guān)關(guān)系不能用倍數(shù)關(guān)系解釋,只能對(duì)親密程度進(jìn)展比較 2.相關(guān)關(guān)系不等于因果關(guān)系,因此不能做類似于“誰(shuí)導(dǎo)致誰(shuí)的產(chǎn)生緣由和結(jié)果的解釋 3.相關(guān)系數(shù)值的大小闡明變量間相關(guān)程度大小偏相關(guān)和部分相關(guān) 4.在純實(shí)際研討中,即使是很小的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論