




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
相關分析和回歸分析一、相關分析(一)相關的概念兩個變量之間不精確、不穩(wěn)定的變化關系稱為相關關系。兩個變量之間的變化關系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。(二)相關的種類1、從變化方向上劃分正相關:一個變量增大,另一個變量對應值也隨之增大;或另一個變量值減小,另一個變量對應值也隨之減小,兩列變量變化方向相同。負相關:一個變量增大,另一個變量對應值也隨之減少;或一個變量值減小,另一個變量對應值也隨之增大,兩列變量變化方向相反。零相關:兩變量值的變化方向無規(guī)律。2、從變量相互關系的程度上劃分無論兩個變量的變化方向是否一致,凡密切程度高的稱為強相關或高度相關;密切程度一般的稱為中度相關;密切程度弱的稱為弱相關或低度相關。(三)相關散布圖它是表示兩種事物之間的相關性及聯(lián)系的模式。以直角坐標的橫軸表示x列變量,縱軸表示y列變量,在相關的兩變量對應值的垂直相交處畫點,構成相關散布圖。相關散布圖的用途:圖5-2(b)直線相關圖5-2(a)曲線相關1、判斷相關是否直線式圖5-2(b)直線相關圖5-2(a)曲線相關圖5-3b低度相關圖5-3(a)高度相關2、判斷相關密切程度高低圖5-3b低度相關圖5-3(a)高度相關圖5-4(a)正相關3、判斷相關變化方向圖5-4(a)正相關圖5-4(b)負相關圖5-4(b)負相關(四)相關系數(shù)用來描述兩個變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關系數(shù)。一般用r表示。注:(1)相關系數(shù)的數(shù)值范圍是。(2)從r的正負以及絕對值的大小,可以表明兩個變量之間變化的方向及密切程度。“+”、“—”號表示變化方向(“+”號表示變化方向一致,即正相關;“—”號表示變化方向相反,即負相關)r的絕對值表示兩變量之間的密切程度(即強度)。絕對值越接近1,表示兩個變量之間關系越密切;越接近0,表示兩個變量之間關系越不密切。(3)相關系數(shù)只能描述兩個變量之間的變化方向及密切程度,并不能揭示兩者之間的內(nèi)在本質(zhì)聯(lián)系。另外若兩變量相關系數(shù)為0,只能表示兩變量間沒有線性關系,也可能存在曲線關系,即r=0,并不意味著兩變量是獨立的。(五)積差相關1.積差相關的概念當兩個變量都是正態(tài)連續(xù)變量,且兩者之間呈線性關系時,表示這兩個變量之間的相關稱為積差相關。2.積差相關的適用條件(1)兩變量均應由測量得到的連續(xù)性數(shù)據(jù)(量—量數(shù)據(jù))。兩個變量的總體都呈是正態(tài)分布,或接近正態(tài)的單峰對稱分布。3.積差相關系數(shù)的定義公式積差相關系數(shù)就是兩個變量標準分數(shù)乘積之和除以n所得之商。用公式可表示為:在此:表示X變量的樣本標準差,表示Y變量的樣本標準差。(六)相關系數(shù)的顯著性檢驗1.:條件下,相關系數(shù)的顯著性檢驗對于總體相關系數(shù)的零假設進行顯著性檢驗時,又分為兩種情況:(1)當?shù)那闆r當時,r的抽樣分布接近于正態(tài)分布,其檢驗的統(tǒng)計量為:在此r表示兩個變量的積差相關系數(shù)n表示樣本的容量(2)當?shù)那闆r當時,關于的零假設,可以用t統(tǒng)計量來檢驗相關系數(shù)的顯著性。在此r表示兩個變量的積差相關系數(shù)n表示樣本的容量例2.從高一學生中隨機抽取26名學生,其數(shù)學與英語考試成績的積差相關系數(shù)為0.65,試問從總體上講,數(shù)學與英語考試成績是否相關?解:(1)提出假設:(2)選擇檢驗統(tǒng)計量并計算其值由于假設,樣本相關系數(shù)的標準記分呈t分布,故選擇t作為檢驗統(tǒng)計量,將r=0.65,n=26代入公式,則(3)確定檢驗的形式:雙側檢驗(4)統(tǒng)計決斷根據(jù)df=n-2=26-2=24,查t值表得,。由于實際的。根據(jù)統(tǒng)計決斷規(guī)則,在0.01的顯著性水平上拒絕原假設。結論:從總體上看:高一學生數(shù)學與英語考試成績呈正相關。 2.:()條件下,相關系數(shù)的顯著性檢驗檢驗步驟:(1)提出假設(2)查r與的轉(zhuǎn)換表將r轉(zhuǎn)換成,轉(zhuǎn)換成(3)選擇檢驗統(tǒng)計量并計算其值由于的抽樣分布呈正態(tài)分布,則檢驗統(tǒng)計量為在這里表示的標準誤,其中n代表樣本容量(4)、確定檢驗的形式(5)、統(tǒng)計決斷例3,26名高一學生的數(shù)學與英語考試成績的積差相關系數(shù)為0.65是否來自于相關系數(shù)等于0.5的總體?解:提出假設,進行r與的轉(zhuǎn)換:查r與轉(zhuǎn)換表得,與r=0.65相對應的=0.775,與相對應的。選擇統(tǒng)計量并計算—由于的抽樣分布呈正態(tài)分布,故選擇Z作為統(tǒng)計量,將上述數(shù)據(jù)代入公式: 統(tǒng)計決斷:由于實際算出的|Z|=1.08<1.96=,根據(jù)雙側Z檢驗統(tǒng)計決斷規(guī)則,則P>0.05。于是,只得保留原假設。結論是:在0.05的顯著性水平上可以認為,高一學生數(shù)學與英語考試成績總體相關系數(shù)一致,來源于總體。(七)其他相關系數(shù)1.等級相關系數(shù)等級相關是指以等級次序排列或以等級次序表示的變量之間的相關。我們主要介紹斯皮爾曼等級相關。(1)斯皮爾曼等級相關的概念及適用條件兩變量是等級測量數(shù)據(jù),且總體不一定呈正態(tài)分布,樣本容量也不一定大于30,這樣兩變量的相關,稱為斯皮爾曼等級相關。適用條件:①兩變量的資料為等級測量數(shù)據(jù),且具有線性關系。②對于粗略估計到的連續(xù)變量的測量數(shù)據(jù),按其大小排成等級,亦可用等級相關計算。③不要求總體呈正態(tài)分布。(2)相關系數(shù)的計算計算等級相關系數(shù)的公式為:在這里表示等級相關系數(shù)D表示兩個變量每對數(shù)據(jù)等級(不是指原始的等級)之差n表示樣本的容量注:若出現(xiàn)相同的等級分數(shù)時,可用它們所占等級位置的平均數(shù)作為它們的等級。如下例,X列中90分有兩個,且所占等級位置分別為3、4,故取它們的平均值(3+4)/2=3.5。例4,某校為了研究學生自學能力與學業(yè)成績之間的關系,隨機抽取10名學生的自學能力和學科成績,見下表,求其相關系數(shù)。序號X(能力)等級Y(成績)等級D 1903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-10.25 25.5解:即學生的自學能力與學習成績的相關程度是0.852.點二列相關(質(zhì)—量相關)(1)概念及適用條件兩列變量一列是正態(tài)連續(xù)變量,另一列是二分變量,描述這兩個變量之間的相關,稱為點二列相關。適用條件:一列是正態(tài)連續(xù)變量,另一列是二分變量(如男與女,對與錯等)。(2)相關系數(shù)的計算在此p為二分變量中某一項所占比例q為二分變量中另一項所占比例為二分變量中比例為p部分所對應的連續(xù)變量的平均數(shù)為二分變量中比例為q部分所對應的連續(xù)變量的平均數(shù)為連續(xù)變量的標準差另一種表示形式為:在這里表示連續(xù)變量中所有分數(shù)的平均數(shù)(八)相關分析小結一、如何判斷兩個變量的相關性——步驟(1)找出兩個變量的正確相應數(shù)據(jù);(2)畫出它們的散布圖(散點圖);(3)通過散布圖判斷它們的相關性;(4)給出相關系數(shù)的解答;(5)對結果進行評價和顯著性檢驗。二、知識結構一覽表 相關類型相關系數(shù)水平顯著性檢驗適用條件統(tǒng)計量檢驗類備注量-量相關積差相關系數(shù)r=(n<50)T檢驗小樣本(n>50)Z檢驗大樣本,近似于正態(tài)分:Z檢驗近似于正態(tài)分質(zhì)-質(zhì)相關等級相關系數(shù)兩類都是等級變量T檢驗非正態(tài)分布質(zhì)-量相關點二列相一列是正態(tài)變量一列是二分變量采用積差相關系數(shù)的檢驗方法同上同上查表法——df=n-2,找到相關系數(shù)的臨界值,將計算所得的值與臨界值進行比較,若小于臨界值,保留原假設,否則,拒絕。。T檢驗非正態(tài)分布二、回歸分析相關表示兩個變量之間的雙向相互的關系。如果我們將存在相關的兩個變量,一個作為自變量,另一個作為因變量,并把兩者之間不十分準確、穩(wěn)定的關系,用數(shù)學方程式來表達,則可利用該方程由自變量的值來估計、預測因變量的估計值,這一過程稱為回歸分析。可見,回歸表示一個變量隨另一個變量作不同程度變化的單向關系。回歸分析的目的在于了解兩個或多個變量間是否相關、相關方向與強度,并建立數(shù)學模型以便觀察特定變量來預測研究者感興趣的變量。在教育研究中,不少變量之間存在一定的關系,但是由于關系比較復雜,而且受偶然因素影響較大,兩者只是一種不十分確定的回歸關系。如果散點的分布有明確的直線趨勢,我們就可以配制一條最能代表散點圖上分布趨勢的直線,這條最優(yōu)擬合線即稱為回歸線。確定回歸線的方程稱為回歸方程。(一)一元線性回歸方程的建立一元線性回歸方程的通式為,式中a是回歸線在Y軸上的截距;b是回歸線的斜率,稱為回歸系數(shù)。如何求a、b?方法一:用最小二乘法確定a、b:我們構造一元線性回歸方程,用來估計實際值y,要使這樣估計獲得最好的效果。那么,a、b的值應該使的值最小,由于用計算,有正有負,總體上看趨向于0。因此,在計算時,我們對其取平方值,用,求a、b,使得最小。因此,構造一個新的函數(shù),令求出Q(a,b)的最小值點——根據(jù)微積分求極值原理:(2)(1)(2)(1)將代入(2)中運用最小二乘法,確定回歸方程:方法二:在r(相關系數(shù))已知的情況下,可以代入以下公式::Y的標準差:X的標準差一元線性回歸方程的檢驗用回歸系數(shù)檢驗回歸方程的顯著性模型:首先,提出原假設和備擇假設:其次,確定并計算統(tǒng)計量:最后,統(tǒng)計決斷:查自由度為n-2的t值分布表,若,拒絕原假設,認為X對Y有顯著影響。 2、用積差相關系數(shù)檢驗回歸方程的顯著性采用統(tǒng)計量:(同積差相關系數(shù)顯著性檢驗)3、用方差分析檢驗回歸方程的顯著性回歸平方和所占比重越大,誤差平方和所占比重就越小,意味著變量間線性關系就越顯著。所以,回歸方程的顯著性,可以采用回歸平方和的分析來進行。總平方和=回歸平方和+誤差平方和方差分析檢驗的過程1.提出假設:2.采用統(tǒng)計量:注:F= 3.查表并作統(tǒng)計推斷:當F<,接受,不存在顯著關系;當,在0.05水平上拒絕原假設;當,在0.01水平上拒絕原假設。 15名學生的數(shù)學分數(shù)與物理分數(shù)計算表序號 13132-1.40-6.731.9645.299.422238-9.40-30.7388.36944.33288.86340697.6030.2757.76916.27230.0541921-13.40-17.73179.56314.35273.585606627.6027.27761.76743.65752.6561541-17.402.27302.765.15-39.507465713.6018.27184.96333.79248.478267-6.40-31.7340.961006.79203.0793257-0.4018.270.16333.79-7.31103037-2.40-173.005.762.994.1511586825.6029.27655.36856.73749.31122827-4.40-11.7319.36137.5951.61132241-10.402.27108.165.19-23.61142321-9.40-18.7388.36305.81176.601533300.60-8.730.3676.21-5.24總和4865816072.932875.60平均32.438.73例5,對建立的數(shù)學分數(shù)預測物理分數(shù)的回歸方程進行顯著性檢驗。解:提出假設:(1)用回歸系數(shù)檢驗回歸方程的顯著性由表11.1中的結果得:由表中數(shù)據(jù),計算帶入查表得,結論:在0.01的顯著性水平上拒絕,其回歸方程是顯著的。(2)用積差相關系數(shù)檢驗回歸方程的顯著性由于N<50,采用統(tǒng)計量查表得所以,在0.01的顯著性水平上拒絕原假設,認為回歸方程是顯著的。(3)用方差分析檢驗回歸方程的顯著性由于查表得,因為所以,在0.01水平上拒絕原假設,認為兩個變量間回歸關系極其顯著。綜上所述:三種檢驗方法得到的結果是相同的,可見,三種檢驗具有等效性。參考文獻【1】《教育統(tǒng)計與測量評價新編教程》【M】黃光揚,原霞,華東師范大學出版社【2】《教育統(tǒng)計學》第4版【M】王孝玲,華東師范大學出版社【3】《教育統(tǒng)計與測量導論》【M】劉新平,劉存?zhèn)b,科學出版社【4】《教育統(tǒng)計學—思想、方法與應用》第2版【M】徐文彬,南京師范大學文獻使用情況:相關分析主要借鑒的是王孝玲的《教育統(tǒng)計學》。例如相關的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設備設施維修管理制度
- 2025年中國加壓蒸汽清潔器行業(yè)市場全景分析及前景機遇研判報告
- 設計培訓風險管理制度
- 證書執(zhí)照使用管理制度
- 診所護士外出管理制度
- 2025年中國滑雪鏟行業(yè)市場全景分析及前景機遇研判報告
- 試驗車輛歸口管理制度
- 財務銀行對賬管理制度
- 財政投資項目管理制度
- 貨物寄存?zhèn)}庫管理制度
- (高清版)DB32∕T 3550-2019 住宿業(yè)清洗消毒衛(wèi)生規(guī)范
- 2025年粵教滬科版三年級英語上冊月考試卷含答案
- 《XRD分析課件》課件
- 低壓配電系統(tǒng)維護與管理方案
- 事業(yè)單位聘用臨時工勞動合同模板2025年
- 設備安裝與調(diào)試作業(yè)指導書
- 學前兒童科學教育活動指導-002-國開機考復習資料
- 數(shù)字與圖像處理-終結性考核-國開(SC)-參考資料
- 再生障礙性貧血診斷與治療中國指南(2024年版)解讀
- 《旅游概論》考試復習題庫(附答案)
- 內(nèi)蒙古呼和浩特市(2024年-2025年小學五年級語文)人教版綜合練習(下學期)試卷及答案
評論
0/150
提交評論