




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.第七章第七章 相關分析和線性回歸分析相關分析和線性回歸分析.一、相關分析和回歸分析概述一、相關分析和回歸分析概述v相關分析和回歸分析都是分析客觀事物之相關分析和回歸分析都是分析客觀事物之間關系的數量分析方法。間關系的數量分析方法。v客觀事物之間的關系大致可以歸納為客觀事物之間的關系大致可以歸納為2 2類:類:函數關系:兩事物之間一一對應的關系。函數關系:兩事物之間一一對應的關系。統計關系:兩事物之間的一種非一一對應的統計關系:兩事物之間的一種非一一對應的關系。統計關系可再進一步分為線性相關關系。統計關系可再進一步分為線性相關和非線性相關和非線性相關正相關:兩個變量線性的相隨變動方向相同。正相
2、關:兩個變量線性的相隨變動方向相同。負相關:兩個變量線性的相隨變動方向相反。負相關:兩個變量線性的相隨變動方向相反。.v事物之間的函數關系比較容易分事物之間的函數關系比較容易分析和測度,而統計關系卻不像函析和測度,而統計關系卻不像函數關系那樣直接,但確實普遍存數關系那樣直接,但確實普遍存在,并且有的關系強,有的關系在,并且有的關系強,有的關系弱,程度各異。相關分析和回歸弱,程度各異。相關分析和回歸分析正是以不同的方式測度事物分析正是以不同的方式測度事物間統計關系的非常有效的工具。間統計關系的非常有效的工具。.二、相關分析二、相關分析v通過圖形和數值兩種方式,能夠通過圖形和數值兩種方式,能夠有效
3、地揭示事物之間統計關系的有效地揭示事物之間統計關系的強弱程度。強弱程度。v散點圖:將數據以點的形式畫在散點圖:將數據以點的形式畫在直角平面上。(直觀)直角平面上。(直觀)v相關系數相關系數.(二)散點圖(二)散點圖v含義含義v簡單散點圖:生成一對相關變量的散簡單散點圖:生成一對相關變量的散點圖點圖v重疊散點圖:生成多對相關變量的散重疊散點圖:生成多對相關變量的散點圖點圖v矩陣散點圖:同時生成多對相關變量矩陣散點圖:同時生成多對相關變量的矩陣散點圖的矩陣散點圖v三維散點圖:生產成三個變量之間的三維散點圖:生產成三個變量之間的三維散點圖三維散點圖.散點圖的基本操作散點圖的基本操作v簡單散點圖簡單散
4、點圖v重疊散點圖重疊散點圖v矩陣散點圖矩陣散點圖v三維散點圖三維散點圖.練習練習v高校科研研究高校科研研究.sav:.sav:v繪制課題總數與論文數的簡單散點繪制課題總數與論文數的簡單散點圖,并分析它們之間的線性關系。圖,并分析它們之間的線性關系。v繪制課題總數、投入科研經費以及繪制課題總數、投入科研經費以及論文數的矩陣散點圖,并分析它們論文數的矩陣散點圖,并分析它們之間的線性關系。之間的線性關系。.相關系數相關系數v雖然散點圖能夠直觀的展現變量之間的統雖然散點圖能夠直觀的展現變量之間的統計關系,但并不精確。相關系數以數值的計關系,但并不精確。相關系數以數值的方式精確的反映了兩個變量間線性相關
5、的方式精確的反映了兩個變量間線性相關的強弱程度,利用相關系數進行變量間線性強弱程度,利用相關系數進行變量間線性關系的分析通常需要完成以下兩大步驟。關系的分析通常需要完成以下兩大步驟。v計算樣本相關系數計算樣本相關系數r。(不同類型的變量。(不同類型的變量應采用不同的相關系數指標,但他們的取應采用不同的相關系數指標,但他們的取值范圍和含義都是相同的。)值范圍和含義都是相同的。)v對樣本來自的兩總體是否存在顯著的線性對樣本來自的兩總體是否存在顯著的線性關系進行推斷。關系進行推斷。.相關系數相關系數r rv相關系數相關系數r r的取值在的取值在-1-1+1+1之間。之間。vr0r0表示兩變量存在正的
6、線性相關關系表示兩變量存在正的線性相關關系;r0;r0.80.8表示兩變量之間具有較強的線性表示兩變量之間具有較強的線性關系關系; ; r r0.34040)v6 6、必須是連續變量、必須是連續變量.多元回歸方程中的自變量選擇多元回歸方程中的自變量選擇v1 1、強行進入法(、強行進入法(enterenter),即一般),即一般所稱的復回歸分析法。強迫所有變所稱的復回歸分析法。強迫所有變量有順序地進入回歸方程。在研究量有順序地進入回歸方程。在研究設計中,如果研究者事先建立假設,設計中,如果研究者事先建立假設,決定變量的重要性層次,則應使用決定變量的重要性層次,則應使用enterenter法比較合
7、適。此法又稱法比較合適。此法又稱“層次層次式進入法式進入法”(hierarchical hierarchical enterenter)。)。.v2 2、后退法(、后退法(BackwardBackward),將已納入方程的),將已納入方程的變量按對因變量的貢獻大小由小到大依次變量按對因變量的貢獻大小由小到大依次剔除,每剔除一個自變量,即重新檢驗每剔除,每剔除一個自變量,即重新檢驗每一自變量對因變量的貢獻。一自變量對因變量的貢獻。v3 3、前進法(、前進法(ForwardForward),對已納入方程的),對已納入方程的變量不考察其顯著性,直到方程外變量均變量不考察其顯著性,直到方程外變量均達不
8、到入選標準。達不到入選標準。v4 4、強制剔除法(、強制剔除法(RemoveRemove)與后退法相同,)與后退法相同,只是篩選的是只是篩選的是BlockBlock.v5 5、逐步回歸法(、逐步回歸法( Stepwise Stepwise ),運用很廣,報),運用很廣,報告中出現的幾率最高。結合了前進法和后退法的告中出現的幾率最高。結合了前進法和后退法的優點。第一,模型中先不包含任何預測變量,與優點。第一,模型中先不包含任何預測變量,與因變量相關最高者首先進入回歸方程;第二,控因變量相關最高者首先進入回歸方程;第二,控制回歸方程中的變量后,根據每個預測變量與因制回歸方程中的變量后,根據每個預測
9、變量與因變量的偏相關的高低來決定進入方程的順序;第變量的偏相關的高低來決定進入方程的順序;第三,已進入方程的自變量,每引入一個自變量,三,已進入方程的自變量,每引入一個自變量,就對方程中的每一自變量進行顯著性檢驗,若發就對方程中的每一自變量進行顯著性檢驗,若發現不顯著,就剔除;每剔除一個自變量有也對留現不顯著,就剔除;每剔除一個自變量有也對留在方程中的自變量再進行顯著性檢驗,再不顯著,在方程中的自變量再進行顯著性檢驗,再不顯著,又剔除,直至沒有自變量引入,也沒有自變量剔又剔除,直至沒有自變量引入,也沒有自變量剔除為止。除為止。.v在選擇回歸的方法時,注意專業上在選擇回歸的方法時,注意專業上的要
10、求要先于統計學檢驗的準則。的要求要先于統計學檢驗的準則。vHowerHower(19871987)建議:()建議:(1 1)應優先)應優先使用使用enterenter或或stepwisestepwise。(。(2 2)使用)使用enterenter時,可根據研究計劃時的相關時,可根據研究計劃時的相關理論,決定變量投入的順序。理論,決定變量投入的順序。.回歸方程的統計檢驗回歸方程的統計檢驗v通過樣本數據建立回歸方程后一般不通過樣本數據建立回歸方程后一般不能立即用于對實際問題的分析和預測,能立即用于對實際問題的分析和預測,通常要進行各種統計檢驗,包括回歸通常要進行各種統計檢驗,包括回歸方程的擬合優
11、度檢驗、回歸方程的顯方程的擬合優度檢驗、回歸方程的顯著性檢驗、回歸系數的顯著性檢驗、著性檢驗、回歸系數的顯著性檢驗、殘差分析等。殘差分析等。.回歸方程的擬合優度檢驗回歸方程的擬合優度檢驗v檢驗樣本數據點聚集在回歸線周圍的密集檢驗樣本數據點聚集在回歸線周圍的密集程度,從而評價回歸方程對樣本數據的代程度,從而評價回歸方程對樣本數據的代表程度。表程度。v認為認為y y各觀測值的之間的差異主要由兩個方各觀測值的之間的差異主要由兩個方面的原因造成:一是解釋變量面的原因造成:一是解釋變量x x取值的不同取值的不同造成的;二是由于其他隨機因素造成的。造成的;二是由于其他隨機因素造成的。vSST=SSA+SS
12、ESST=SSA+SSE(回歸平方和剩余平方和)(回歸平方和剩余平方和)v若若SSASSA所占的比例遠大于所占的比例遠大于SSESSE所占的比例,所占的比例,那么回歸方程的擬合優度會比較高。那么回歸方程的擬合優度會比較高。.v擬合優度檢驗采用擬合優度檢驗采用R R2 2統計量,該統計量統計量,該統計量稱為判定系數或決定系數,它是稱為判定系數或決定系數,它是SSA/SSTSSA/SSTv反映因變量的全部變異中能夠通過回歸反映因變量的全部變異中能夠通過回歸關系被自變量解釋的比例,即檢驗回歸關系被自變量解釋的比例,即檢驗回歸的效果如何。的效果如何。v如果自變量的個數很多,有時要以調整如果自變量的個數
13、很多,有時要以調整后的決定系數代替原先的決定系數。因后的決定系數代替原先的決定系數。因為增加新的自變量會使決定系數增大,為增加新的自變量會使決定系數增大,這種決定系數會有高人為控制的機制在這種決定系數會有高人為控制的機制在內,此時用調整后的決定系數更好。內,此時用調整后的決定系數更好。.回歸方程的顯著性檢驗回歸方程的顯著性檢驗v線性回歸方程能夠較好地反映被解釋變量線性回歸方程能夠較好地反映被解釋變量和解釋變量之間統計關系的前提應是,被和解釋變量之間統計關系的前提應是,被解釋變量和解釋變量之間確實存在顯著的解釋變量和解釋變量之間確實存在顯著的線性關系。回歸方程的顯著性檢驗正是要線性關系。回歸方程
14、的顯著性檢驗正是要檢驗被解釋變量與所有解釋變量之間的線檢驗被解釋變量與所有解釋變量之間的線性關系是否顯著,用線性模型來描述它們性關系是否顯著,用線性模型來描述它們之間的關系是否恰當。之間的關系是否恰當。v基本出發點與擬合優度檢驗非常相似。基本出發點與擬合優度檢驗非常相似。v檢驗采用檢驗采用F統計量。統計量。.回歸系數的顯著性檢驗回歸系數的顯著性檢驗v主要目的是研究回歸方程中的每個解釋主要目的是研究回歸方程中的每個解釋變量與被解釋變量之間是否存在顯著的變量與被解釋變量之間是否存在顯著的線性關系,也就是研究解釋變量能夠有線性關系,也就是研究解釋變量能夠有效地解釋被解釋變量的線性變化,他們效地解釋被
15、解釋變量的線性變化,他們能夠保留在線性回歸方程中。能夠保留在線性回歸方程中。v是圍繞回歸系數估計值的抽樣分布展開是圍繞回歸系數估計值的抽樣分布展開的,由此構造服從某種理論分布的檢驗的,由此構造服從某種理論分布的檢驗統計量,并進行檢驗。統計量,并進行檢驗。.vt t統計量:在一元線性回歸分析中,統計量:在一元線性回歸分析中,回歸方程顯著性檢驗和回歸系數顯回歸方程顯著性檢驗和回歸系數顯著性檢驗的作用是相同的,兩者可著性檢驗的作用是相同的,兩者可以相互代替,同時回歸方程顯著性以相互代替,同時回歸方程顯著性檢驗中檢驗中F Ft t2 2。v但在多元線性回歸中的這兩種檢驗但在多元線性回歸中的這兩種檢驗通
16、常不能互相替代。通常不能互相替代。.殘差分析殘差分析v所謂殘差是指由回歸方程計算所得的預測值與所謂殘差是指由回歸方程計算所得的預測值與實際樣本值之間的差距。實際樣本值之間的差距。v殘差分析是回歸方程檢驗中的重要組成部分,殘差分析是回歸方程檢驗中的重要組成部分,其出發點是,如果回歸方程能較好地反映被解其出發點是,如果回歸方程能較好地反映被解釋變量的特征和變化規律,那么殘差序列中應釋變量的特征和變化規律,那么殘差序列中應不包含明顯的規律行和趨勢性。不包含明顯的規律行和趨勢性。v殘差分析的主要任務可大致歸納為,分析殘差殘差分析的主要任務可大致歸納為,分析殘差是否服從均值為是否服從均值為0 0的正態分
17、布、分析殘差是否為的正態分布、分析殘差是否為等方差的正態分布、分析殘差序列是否獨立、等方差的正態分布、分析殘差序列是否獨立、借助殘差探測樣本中的異常值等。借助殘差探測樣本中的異常值等。v圖形分析和數值分析是殘差分析的有效工具。圖形分析和數值分析是殘差分析的有效工具。.如何看回歸結果?如何看回歸結果?v哪些自變量(我們選定)進入了回哪些自變量(我們選定)進入了回歸方程歸方程v對回歸方程進行檢驗,看方程是否對回歸方程進行檢驗,看方程是否有意義有意義v看回歸效果,看回歸效果, R R2 2.回歸分析的三個重要指標回歸分析的三個重要指標v方差分析:方差分析:F F檢驗用于檢驗回歸模型與數檢驗用于檢驗回
18、歸模型與數據的擬合程度。若據的擬合程度。若F F值顯著,表明預測變值顯著,表明預測變量與指標變量之間存在很強的線性關系,量與指標變量之間存在很強的線性關系,也可以說回歸方程顯著。也可以說回歸方程顯著。 v回歸系數的顯著性檢驗:若回歸系數的顯著性檢驗:若b b顯著,則表顯著,則表明預測變量與指標變量之間存在強線性明預測變量與指標變量之間存在強線性相關。相關。 vR R2 2:解釋回歸平方和在總平方和中所占:解釋回歸平方和在總平方和中所占的比率,即解釋回歸的效果。的比率,即解釋回歸的效果。.練習練習v利用線性回歸分析研究高等院校人利用線性回歸分析研究高等院校人文社會科學研究中立項課題數是否文社會科
19、學研究中立項課題數是否受高級職稱投入人年數、投入科研受高級職稱投入人年數、投入科研事業經費、專著數的影響。事業經費、專著數的影響。v分析母親對情感溫暖的理解是否受分析母親對情感溫暖的理解是否受到過度干涉、拒絕否認和懲罰嚴厲到過度干涉、拒絕否認和懲罰嚴厲的影響。的影響。.虛擬變量虛擬變量v若某個自變量是分類變量,則須將分類變量若某個自變量是分類變量,則須將分類變量轉化為二進制虛擬變量(轉化為二進制虛擬變量(dummy variabledummy variable),),每個虛擬變量只代表每個虛擬變量只代表2 2級(級(0 0,1 1),即某一屬),即某一屬性出現時,虛擬變量取值為性出現時,虛擬變
20、量取值為1 1,否則為,否則為0 0。設。設虛擬變量時,以一種取值作為對比水平(基虛擬變量時,以一種取值作為對比水平(基礎水平),若原自變量有幾個水平,就應使礎水平),若原自變量有幾個水平,就應使用用n-1n-1個虛擬變量,實則虛擬變量代表的是同個虛擬變量,實則虛擬變量代表的是同一變量的不同取值。一變量的不同取值。.v如性別變量有男或女兩類如性別變量有男或女兩類, ,可將兩個類別可將兩個類別分別以兩個分別以兩個0/10/1二值變量的形式重新編碼。二值變量的形式重新編碼。設置變量設置變量X X1 1表示是否男,取表示是否男,取1 1表示男,取表示男,取0 0表示不是男。再設置變量表示不是男。再設
21、置變量X X2 2表示是否女,表示是否女,取取1 1表示是女,取表示是女,取0 0表示不是女。表示不是女。v產生的回歸方程中各虛擬變量回歸系數的產生的回歸方程中各虛擬變量回歸系數的含義是,相對參照類,各個類對解釋變量含義是,相對參照類,各個類對解釋變量平均貢獻的差,進而可進一步研究各類別平均貢獻的差,進而可進一步研究各類別間對被解釋變量的平均貢獻差異。間對被解釋變量的平均貢獻差異。.Collinearity Collinearity diagnostics diagnostics (共線性診斷)(共線性診斷)v復共線問題(共線性,復共線問題(共線性,collinearitycollineari
22、ty問問題):由于自變量間的相關太高,造成題):由于自變量間的相關太高,造成回歸分析之情境困擾。如果自變量間有回歸分析之情境困擾。如果自變量間有共線性問題,表示一個預測變量是其他共線性問題,表示一個預測變量是其他自變量的線性組合。若有嚴重的共線性自變量的線性組合。若有嚴重的共線性存在,則模型的參數就不能完全被估計存在,則模型的參數就不能完全被估計出來。出來。.自變量間是否有共線性問題,自變量間是否有共線性問題,可以由以下數據判斷:可以由以下數據判斷:(1 1)VIF=5VIF=5,存在復共線。所以在回歸分析中,存在復共線。所以在回歸分析中,最好先做個相關分析,最好先做個相關分析,以探討變量間的
23、相關情形,以探討變量間的相關情形,如果某些變量間的相關系數太高,可考慮挑選一如果某些變量間的相關系數太高,可考慮挑選一個較重要的變量投入回歸分析個較重要的變量投入回歸分析。(2 2)容忍度)容忍度tolerance=1-Rtolerance=1-R2 2 ,其中,其中R R2 2是此自變量是此自變量與其他自變量間的多元相關系數的平方。容忍度與其他自變量間的多元相關系數的平方。容忍度界于界于0 0和和1 1之間,如果一個自變量的容忍度太小,之間,如果一個自變量的容忍度太小,表示此變量與其他自變量間有共線性問題;其值表示此變量與其他自變量間有共線性問題;其值若接近若接近0 0,表示此變量幾乎就是其
24、他變量的線性,表示此變量幾乎就是其他變量的線性組合。組合。.(3 3)條件指針()條件指針(condition indexcondition index,CICI),),CI CI 越大,越有共線性問題。越大,越有共線性問題。Eigenvalue condition indexEigenvalue condition index(k k)若)若k k2 2=100=100表示存在復共線,若表示存在復共線,若k k2 2=1000=1000,表示存在嚴重的復共線。表示存在嚴重的復共線。v關于復共線問題,也有說法,即認為關于復共線問題,也有說法,即認為若若torrencetorrence降至降至0
25、.50.5以下,而以下,而VIF VIF 上升上升到到2.02.0以上,就應檢查自變量是否為自以上,就應檢查自變量是否為自相關。相關。.上機練習上機練習v母親的受教育程度和職業狀況與母母親的受教育程度和職業狀況與母親的情感溫暖的理解有什么關系?親的情感溫暖的理解有什么關系?請根據相關分析的進行分析。請根據相關分析的進行分析。v年均可支配收入和年人均消費支出年均可支配收入和年人均消費支出是否對教育支出有影響?請用回歸是否對教育支出有影響?請用回歸分析的結果建立關于教育支出的回分析的結果建立關于教育支出的回歸模型。歸模型。.五、路徑分析五、路徑分析v路徑分析又稱路徑分析又稱“結構方程模型結構方程模
26、型”(structural equation modelsstructural equation models,SEMSEM)或)或“同時方程檢驗模型同時方程檢驗模型”(simultaneous equation simultaneous equation modelsmodels),因為它同時讓所有預測),因為它同時讓所有預測變量進入回歸模型變量進入回歸模型 。.路徑分析的基本步驟路徑分析的基本步驟v1 1、根據相關理論與文獻資料,建立一個可以檢驗的初、根據相關理論與文獻資料,建立一個可以檢驗的初始模型,并繪出一個沒有路徑系數的路徑圖(始模型,并繪出一個沒有路徑系數的路徑圖(path pat
27、h diagramdiagram)。)。路徑圖中的因果關系用箭頭表示,箭頭指向的是路徑圖中的因果關系用箭頭表示,箭頭指向的是“果果”(因(因變量),箭頭起始處是變量),箭頭起始處是“因因”(自變量)。對多重回歸分析(自變量)。對多重回歸分析來說,箭頭所指的變量為回歸方程的因變量,箭頭起始處為來說,箭頭所指的變量為回歸方程的因變量,箭頭起始處為回歸方程的預測變量?;貧w方程的預測變量。在設計因果關系時,要有相應的理論背景。因果模型結構的在設計因果關系時,要有相應的理論背景。因果模型結構的初始圖中通常包括直接效果和間接效果。在直接效果中如果初始圖中通常包括直接效果和間接效果。在直接效果中如果路徑系數
28、達到顯著,表示兩個變量間有直接因果關系存在;路徑系數達到顯著,表示兩個變量間有直接因果關系存在;在間接效果中如果路徑系數達到顯著,表示兩個變量間有間在間接效果中如果路徑系數達到顯著,表示兩個變量間有間接的因果關系存在。間接效果的影響路徑是多元的,并不是接的因果關系存在。間接效果的影響路徑是多元的,并不是每個中間變量的影響都會達到顯著。每個中間變量的影響都會達到顯著。.v2 2、選用適當的回歸模型(通常用、選用適當的回歸模型(通常用enterenter法),來估計路徑系數并檢驗其是否顯法),來估計路徑系數并檢驗其是否顯著。在路徑分析中,選用的分析方法是著。在路徑分析中,選用的分析方法是多重回歸分
29、析,而多重回歸分析,而“路徑系數路徑系數”就是回就是回歸方程中的歸方程中的“標準化偏回歸系數標準化偏回歸系數”。復。復回歸中讓所有預測變量同時進入回歸方回歸中讓所有預測變量同時進入回歸方程,再由每個變量的程,再由每個變量的t t值的大小與機率值值的大小與機率值檢驗檢驗betabeta值的影響是否顯著。值的影響是否顯著。.v3 3、評估理論模型,可刪除不顯著的路徑、評估理論模型,可刪除不顯著的路徑系數,重新計算新模型的路徑系數。在系數,重新計算新模型的路徑系數。在刪除部分影響路徑后,會成為一種刪除部分影響路徑后,會成為一種“約約束模型束模型”(restrict modelrestrict mod
30、el),由于預),由于預測變量數的改變,路徑系數也會跟著改測變量數的改變,路徑系數也會跟著改變,因而要重新進行復回歸分析。變,因而要重新進行復回歸分析。.驗證研究路徑圖驗證研究路徑圖數學焦慮數學焦慮數學態度數學態度數學成績數學成績數學投入數學投入動機動機.v此研究圖,要進行三個復回歸,此研究圖,要進行三個復回歸,(1 1)因變量為數學成績,預測變量為數)因變量為數學成績,預測變量為數學焦慮、數學態度、數學投入動學焦慮、數學態度、數學投入動(2 2)目標變量為數學學習態度,預測變)目標變量為數學學習態度,預測變量為數學焦慮、數學學習投入動機量為數學焦慮、數學學習投入動機(3 3)目標變量為數學學
31、習投入動機,預)目標變量為數學學習投入動機,預測變量為數學焦慮。測變量為數學焦慮。.練習練習母親情感母親情感溫暖的理溫暖的理解解過度干涉過度干涉心理健康心理健康拒絕否拒絕否認認.曲線估計曲線估計v變量間相關關系的分析中,變量之間變量間相關關系的分析中,變量之間的關系并不總是表現出線性關系的關系并不總是表現出線性關系, ,非非線性關系也是極為常見的,通過繪制線性關系也是極為常見的,通過繪制散點圖的方式可粗略考察這種非線性散點圖的方式可粗略考察這種非線性關系。對于非線性關系通常無法直接關系。對于非線性關系通常無法直接通過線性回歸來分析,無法直接建立通過線性回歸來分析,無法直接建立線性模型,線性模型
32、,v變量之間的非線性可以劃分為本質線變量之間的非線性可以劃分為本質線性關系和本質非線性關系。性關系和本質非線性關系。.v所謂本質線性關系是指變量關系形式上雖所謂本質線性關系是指變量關系形式上雖然是呈非線性關系(如,二次曲線),但然是呈非線性關系(如,二次曲線),但可通過變換化為線性關系,并可最終通過可通過變換化為線性關系,并可最終通過線性回歸分析建立線性模型。線性回歸分析建立線性模型。v本質非線性關系是指變量關系不僅形式上本質非線性關系是指變量關系不僅形式上呈非線性關系,而且也無法通過變量變換呈非線性關系,而且也無法通過變量變換化為線性關系,最終無法通過線性回歸分化為線性關系,最終無法通過線性
33、回歸分析建立線性模型,曲線估計要解決的就是析建立線性模型,曲線估計要解決的就是本質線性關系問題。本質線性關系問題。.步驟步驟v選擇模型選擇模型vSPSS自動生成參數估計,并輸出自動生成參數估計,并輸出回歸方程顯著性檢驗的回歸方程顯著性檢驗的F值、值、p值、值、判定系數等統計量判定系數等統計量v以判定系數為主要依據選擇最優模以判定系數為主要依據選擇最優模型,并進行預測分析。型,并進行預測分析。.曲線估計(Curve Estimation)v對于對于一元回歸一元回歸,若散點圖的趨勢若散點圖的趨勢不呈線性分布,不呈線性分布,可以利用曲線估可以利用曲線估計方便地進行線計方便地進行線性擬合性擬合(lin
34、er)(liner)、二次擬合二次擬合(Quadratic)(Quadratic)、三次擬合三次擬合(Cubic)(Cubic)等。采用哪種擬等。采用哪種擬合方式主要取決合方式主要取決于各種擬合模型于各種擬合模型對數據的充分描對數據的充分描述述( (看修正看修正Adjusted RAdjusted R2 2 -1)1)不同模型的表示不同模型的表示模型名稱模型名稱回歸方程回歸方程相應的線性回歸方程相應的線性回歸方程Linear(Linear(線性線性) )Y=bY=b0 0+b+b1 1t tQuadratic(Quadratic(二二次次) )Y=bY=b0 0+b+b1 1t+bt+b2 2
35、t t2 2Compound(Compound(復合復合) )Y=bY=b0 0(b(b1 1t t) )Ln(Y)=ln(bLn(Y)=ln(b0 0)+ln(b)+ln(b1 1)t)tGrowth(Growth(生長生長) )Y=eY=eb0+b1tb0+b1tLn(Y)=bLn(Y)=b0 0+b+b1 1t tLogarithmicLogarithmic( (對數對數) )Y=bY=b0 0+b+b1 1ln(t)ln(t)Cubic(Cubic(三次三次) )Y=bY=b0 0+b+b1 1t+bt+b2 2t t2 2+b+b3 3t t3 3S SY=eY=eb0+b1/tb0
36、+b1/tLn(Y)=bLn(Y)=b0 0+b+b1 1 / / t tExponentialExponential( (指數指數) )Y=bY=b0 0 * * e eb1b1* *t tLn(Y)=ln(bLn(Y)=ln(b0 0)+b)+b1 1t tInverse(Inverse(逆逆) )Y=bY=b0 0+b+b1 1/t/tPower(Power(冪冪) )Y=bY=b0 0(t(tb1 b1 ) )Ln(Y)=ln(bLn(Y)=ln(b0 0)+b)+b1 1ln(t)ln(t)Logistic(Logistic(邏輯邏輯) )Y=1/(1/u+bY=1/(1/u+b0
37、0b b1 1t t) )Ln(1/Y-Ln(1/Y-1/u)=ln(b1/u)=ln(b0 0+ln(b+ln(b1 1)t)t).操作操作v可通過繪制并觀察樣本數據的散點可通過繪制并觀察樣本數據的散點圖粗略確定被解釋變量和解釋變量圖粗略確定被解釋變量和解釋變量之間的相關關系,為曲線擬合中的之間的相關關系,為曲線擬合中的模型選擇提供依據。模型選擇提供依據。.練習練習v年人均收入和教育支出年人均收入和教育支出.sav:分析:分析居民家庭教育支出和消費性支出之居民家庭教育支出和消費性支出之間的關系間的關系.二項二項Logistic回歸回歸v利用多元回歸方法分析變量之間的關系利用多元回歸方法分析變量之間的關系或進行預測時的一個基本要求是,被解或進行預測時的一個基本要求是,被解釋變量應是連續定距變量。如課題數、釋變量應是連續定距變量。如課題數、教育
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 解析2025年Msoffice考試關鍵試題及答案
- 計算機二級MySQL技巧與經驗分享試題及答案
- 財務數據分析中的邏輯框架試題及答案
- 學習路線2025年計算機二級MySQL試題及答案
- 財務成本管理與投資決策試題及答案
- 二級計算機Python批量處理文件考題及答案
- 22025年計算機二級基礎知識全解析試題及答案
- 數據交互格式的演變試題及答案
- 財務成本管理的國際化路徑分析試題答案
- 2025年官方下載C++試題及答案
- NY 5051-2001無公害食品淡水養殖用水水質
- GB/T 70.1-2008內六角圓柱頭螺釘
- 聯合利華POSM展策劃案
- 13-3飛速發展的通信世界 教案
- 下第四單元 崇尚法治精神 復習學案
- 課件:第六章 社會工作項目評估(《社會工作項目策劃與評估》課程)
- 最新超星爾雅《從愛因斯坦到霍金的宇宙》期末考試答案題庫完整版
- 信息技術網絡安全(教案)
- 小學語文近義詞辨析的方法
- 河南省成人高等教育畢業生畢業資格審查表(新表)
- 長方體和正方體表面積的練習課課件
評論
0/150
提交評論