




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第四章第四章 相關分析和回歸分析相關分析和回歸分析2022-3-252相關分析和回歸分析相關分析和回歸分析第一節(jié)第一節(jié) 地理要素間的地理要素間的相關分析相關分析第二節(jié)第二節(jié) 地理要素間的地理要素間的回歸分析回歸分析32022-3-25一一 相關分析的概念相關分析的概念二二 地理要素的相關類型地理要素的相關類型三三 相關程度的程度方法及顯相關程度的程度方法及顯著性檢驗著性檢驗 第一節(jié)第一節(jié) 地理要素間的地理要素間的相關分析相關分析42022-3-25一一 相關分析的概念相關分析的概念就是測度各個變量之間的關系就是測度各個變量之間的關系密切程度的數(shù)學方法。密切程度的數(shù)學方法。相關分析僅限于測定兩個
2、或兩個以相關分析僅限于測定兩個或兩個以上變量具有相關關系者,其主要目的在上變量具有相關關系者,其主要目的在于計算出表示兩個或兩個以上變量間相于計算出表示兩個或兩個以上變量間相關程度和性質(zhì)。關程度和性質(zhì)。2022-3-255 所謂地理相關所謂地理相關,就是運用相關分析法來研究各地理要素間的相互關系和聯(lián)系強度的一種度量指標。2022-3-256n為了研究父親與成年兒子為了研究父親與成年兒子身高之間的關系,卡爾身高之間的關系,卡爾.皮皮爾遜測量了爾遜測量了1078對父子對父子的身高。把的身高。把1078對數(shù)字對數(shù)字表示在坐標上,如圖。表示在坐標上,如圖。n它的形狀象一塊橄欖狀的它的形狀象一塊橄欖狀的
3、云,中間的點密集,邊沿云,中間的點密集,邊沿的點稀少,其主要部分是的點稀少,其主要部分是一個橢圓。一個橢圓。2022-3-257正相關 負相關 完全正相關 完全負相關 零相關 2022-3-258二二 地理要素間的相關類型地理要素間的相關類型曲線相關(非線性相關)曲線相關(非線性相關)按變量按變量 多少多少兩個變量兩個變量兩個以上兩個以上 變量變量直線相關(線性相關)直線相關(線性相關)復相關復相關偏相關偏相關按質(zhì)量按質(zhì)量等級相關(順序相關)等級相關(順序相關)品質(zhì)相關品質(zhì)相關2022-3-259 三三 相關程度的測度方法相關程度的測度方法及顯著性檢驗及顯著性檢驗由于地理相關類型各不相同,因此
4、測度的方法也不同。由于地理相關類型各不相同,因此測度的方法也不同。(一)線性相關程度的測度(一)線性相關程度的測度所謂所謂相關程度相關程度,就是研究它們之間的相互關系是否密切。,就是研究它們之間的相互關系是否密切。所謂所謂相關方向相關方向,又可以分兩種,即正相關和負相關。,又可以分兩種,即正相關和負相關。用來測度直線相關程度和方向的指標就是相關系數(shù)。用來測度直線相關程度和方向的指標就是相關系數(shù)。2022-3-25101、常用的相關系數(shù)的計算公式及檢驗、常用的相關系數(shù)的計算公式及檢驗niniiiniiiyyxxyyxxr11221)(*)()((1)相關系數(shù)的性質(zhì))相關系數(shù)的性質(zhì)相關系數(shù)的分布范
5、圍,介于相關系數(shù)的分布范圍,介于-1-1和和+1+1之間之間當相關系數(shù)為正值時,表示兩個要素(或變數(shù))之間呈正相當相關系數(shù)為正值時,表示兩個要素(或變數(shù))之間呈正相關,相關系數(shù)為負值時,表示兩個要素(或變數(shù))之間為負相關;關,相關系數(shù)為負值時,表示兩個要素(或變數(shù))之間為負相關;相關系數(shù)的絕對值越大。表示兩個要素間相關程度越密切。相關系數(shù)的絕對值越大。表示兩個要素間相關程度越密切。當r=+1時,為完全正相關。R=-1時,為完全負相關;r=0則完全無關。2022-3-2511 相關系數(shù)相關系數(shù)公式簡化公式簡化: : 記記 公式可簡化為公式可簡化為niniiniiiiiniixyyxnyxyyxx
6、L11111)( )(2112121)(niniiiniixxxnxxxL2112121)(niniiiniiyyynyyyLyyxxxyxyLLLr2022-3-2512 相關系數(shù)是根據(jù)要素之間的樣本值計算出來相關系數(shù)是根據(jù)要素之間的樣本值計算出來的,它隨著樣本數(shù)的多少或取樣方式的不同而不的,它隨著樣本數(shù)的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關系數(shù),只有同,因此它只是要素之間的樣本相關系數(shù),只有通過檢驗,才能知道它的可信度。通過檢驗,才能知道它的可信度。 (2)相關系數(shù)的顯著性檢驗)相關系數(shù)的顯著性檢驗 一般情況下,相關系數(shù)的檢驗,是在給定的一般情況下,相關系數(shù)的檢驗,是在
7、給定的置信水平下,通過查相關系數(shù)檢驗的臨界值表來置信水平下,通過查相關系數(shù)檢驗的臨界值表來完成的。完成的。2022-3-2513檢驗相關系數(shù)檢驗相關系數(shù)=0的臨界值(的臨界值(ra)表表prra=f f值稱為自由度,值稱為自由度,其數(shù)值為其數(shù)值為f=n-2f=n-2,這里這里n n為樣本數(shù)為樣本數(shù)a a代表不同的代表不同的顯著性水平顯著性水平表內(nèi)的數(shù)值表內(nèi)的數(shù)值代表不同的代表不同的置信水平下置信水平下相關系數(shù)相關系數(shù)=0=0的臨界的臨界值,值,即即ra公式公式p=p=r rrara=a=a的意的意思是當所計算的相關系數(shù)思是當所計算的相關系數(shù)r r的的絕對值大于在絕對值大于在a a水平下的臨界水
8、平下的臨界值值rara時,兩要素不相關(即時,兩要素不相關(即=0)=0)的可能性只有的可能性只有a a。2022-3-2514相關系數(shù)相關系數(shù)r的具體檢驗方法步驟如下:的具體檢驗方法步驟如下:(1)計算相關系數(shù))計算相關系數(shù)r(2)給定顯著水平)給定顯著水平,按按n-2查相關系數(shù)臨界值,查相關系數(shù)臨界值,查出相應的臨界值查出相應的臨界值(3)比較)比較r的絕對值與臨界值的大小。當?shù)慕^對值與臨界值的大小。當r的絕的絕對值大于或等于臨界值時,說明兩變量在對值大于或等于臨界值時,說明兩變量在水平水平上達到顯著性;若小于臨界值,則說明兩變量沒上達到顯著性;若小于臨界值,則說明兩變量沒有達到所要求的精
9、度。有達到所要求的精度。如果仍需研究二者的關系如果仍需研究二者的關系,可考慮降低精度,即修改顯著性水平,可考慮降低精度,即修改顯著性水平、相關系數(shù)的顯著性檢驗步驟相關系數(shù)的顯著性檢驗步驟2022-3-25152、等級相關系數(shù)的計算公式及檢驗、等級相關系數(shù)的計算公式及檢驗表示兩個變量順序間直線相關程度和方向表示兩個變量順序間直線相關程度和方向的系數(shù),稱為等級(或順序)相關系數(shù)。等級的系數(shù),稱為等級(或順序)相關系數(shù)。等級相關系數(shù)不僅適用于數(shù)量指標的相關分析,同相關系數(shù)不僅適用于數(shù)量指標的相關分析,同時亦適用于質(zhì)量指標的相關分析。時亦適用于質(zhì)量指標的相關分析。等級相關系數(shù),又稱順序相關系數(shù)是將兩等
10、級相關系數(shù),又稱順序相關系數(shù)是將兩要素的樣本值按數(shù)值的大小順序排列位次,以要素的樣本值按數(shù)值的大小順序排列位次,以各要素樣本值的位次代替實際數(shù)據(jù)而求得的一各要素樣本值的位次代替實際數(shù)據(jù)而求得的一種統(tǒng)計量。實際上,它是位次分析方法的數(shù)量種統(tǒng)計量。實際上,它是位次分析方法的數(shù)量化?;?022-3-2516(1)等級相關系數(shù)的計算公式)等級相關系數(shù)的計算公式) 1(*61212nndRniid2022-3-2517(2)等級相關系數(shù)的計算及檢驗)等級相關系數(shù)的計算及檢驗1985年全國各?。ㄊ?,區(qū)年全國各省(市,區(qū))總人口與社會總產(chǎn)值總人口與社會總產(chǎn)值2022-3-25182022-3-2519即:
11、總人口(即:總人口(x)x)與社會總產(chǎn)值(與社會總產(chǎn)值(y)y)的等級相關系的等級相關系數(shù)為數(shù)為0.7260.7262022-3-2520等級相關系數(shù)檢驗的臨界值等級相關系數(shù)檢驗的臨界值2022-3-2521在上例中,在上例中,n=29n=29,表中沒有給出相應的樣本數(shù),表中沒有給出相應的樣本數(shù)下的臨界值下的臨界值rara,但我們發(fā)現(xiàn),在同一顯著水平,但我們發(fā)現(xiàn),在同一顯著水平下,隨著樣本數(shù)的增大,臨界值下,隨著樣本數(shù)的增大,臨界值rara減少。在減少。在n = 2 8n = 2 8 時 , 查 表 可 知 :時 , 查 表 可 知 : r 0 . 0 5 = 0 . 3 1 7r 0 . 0
12、 5 = 0 . 3 1 7 ,r0.01=0.448r0.01=0.448,由于,由于rxyrxy=0.726=0.726r0.01=0.448r0.01=0.448,故故rxyrxy在在a=0.01a=0.01的置信水平上是顯著的。的置信水平上是顯著的。等級相關系數(shù)檢驗結果等級相關系數(shù)檢驗結果2022-3-2522(二)簡單非線性相關程度的測度(見課本)(二)簡單非線性相關程度的測度(見課本)(三)(三)多要素間相關程度的測定多要素間相關程度的測定1.偏相關系數(shù)的計算與檢驗偏相關系數(shù)的計算與檢驗 在多要素所構成的地理系統(tǒng)中,當我們研究在多要素所構成的地理系統(tǒng)中,當我們研究某一個要素對另一個
13、要素的影響或相關程度時,某一個要素對另一個要素的影響或相關程度時,把其它要素的影響視為常數(shù)(保持不變把其它要素的影響視為常數(shù)(保持不變),即,即暫不考慮其它要素的影響,而單獨研究那兩個暫不考慮其它要素的影響,而單獨研究那兩個要素之間的相互關系的密切程度時,則稱為偏要素之間的相互關系的密切程度時,則稱為偏相關。用以度量偏相關程度的統(tǒng)計量,稱為偏相關。用以度量偏相關程度的統(tǒng)計量,稱為偏相關系數(shù)。相關系數(shù)。2022-3-2523624C當研究當研究2 2個相關變量個相關變量x1x1、x2x2的關系時的關系時,用直線相關,用直線相關系數(shù)系數(shù)r12r12表示表示x1x1與與x2x2線性相關的性質(zhì)與程度。
14、此時固定的線性相關的性質(zhì)與程度。此時固定的變量個數(shù)為變量個數(shù)為0 0,所以直線相關系數(shù),所以直線相關系數(shù)r12r12又叫做零級偏相關系又叫做零級偏相關系數(shù)。數(shù)。當研究當研究3 3個相關變量個相關變量x1x1、x2x2、x3x3的相關時的相關時,我們把我們把x3x3保持固定不變,保持固定不變,x1x1與與x2x2的相關系數(shù)稱為的相關系數(shù)稱為x1x1與與x2x2的偏相關的偏相關系數(shù),記為系數(shù),記為r12.3r12.3,類似地,還有偏相關系數(shù),類似地,還有偏相關系數(shù)r13.2r13.2、 r23.1r23.1。這。這3 3個偏相關系數(shù)固定的變量個數(shù)為個偏相關系數(shù)固定的變量個數(shù)為1 1,所以都叫,所以
15、都叫做一級偏相關系數(shù)。做一級偏相關系數(shù)。當研究當研究4 4個相關變量個相關變量x1x1、x2x2、x3x3、x4x4的相關時的相關時,須將其中的須將其中的2 2個變量固定不變,研究另外兩個變量間的相個變量固定不變,研究另外兩個變量間的相關。即此時只有二級偏相關系數(shù)才真實地反映兩個相關變關。即此時只有二級偏相關系數(shù)才真實地反映兩個相關變量間線性相關的性質(zhì)與程度。二級偏相關系數(shù)共有量間線性相關的性質(zhì)與程度。二級偏相關系數(shù)共有6 6個:個:r12.34r12.34,r13.24r13.24,r14.23r14.23,r23.14r23.14,r24.13r24.13,r34.12r34.12。202
16、2-3-2524624C2/ ) 1(2mmCm一般,當研究一般,當研究m個相關變量個相關變量x1、x2、xm的的相關時,只有將其中的相關時,只有將其中的m-2個變量保持固定不變,個變量保持固定不變,研究另外兩個變量的相關才能真實地反映這兩個研究另外兩個變量的相關才能真實地反映這兩個相關變量間的相關,即此時只有相關變量間的相關,即此時只有m-2級偏相關系數(shù)級偏相關系數(shù)才真實地反映了這兩個相關變量間線性相關的性才真實地反映了這兩個相關變量間線性相關的性質(zhì)與程度。質(zhì)與程度。m-2級偏相關系數(shù)共有級偏相關系數(shù)共有個。個。xi與與xj的的m-2級偏相關系數(shù)記為級偏相關系數(shù)記為rij.(i,j=1,2,
17、m,ij)。2022-3-25252022-3-2526式(式(5)(7)表示三個偏表示三個偏相關系數(shù),相關系數(shù),稱為一級偏稱為一級偏相關系數(shù)。相關系數(shù)。2022-3-2527在式(在式(8)8)中,中,r1234r1234表示在表示在x3x3和和x4x4保持不變保持不變的條件,的條件,x1x1和和x2x2的偏相的偏相關系數(shù)。關系數(shù)。2022-3-25282022-3-25292022-3-25302022-3-2531偏相關系數(shù)具有下述性質(zhì):偏相關系數(shù)具有下述性質(zhì):(1)偏相關系數(shù)分布的范圍在偏相關系數(shù)分布的范圍在-1到到1之間;之間;(2) 偏相關系數(shù)的絕對值越大,表示其偏相關程偏相關系數(shù)
18、的絕對值越大,表示其偏相關程度越大;度越大;(3)偏相關系數(shù)的絕對值必小于或最多等于由同)偏相關系數(shù)的絕對值必小于或最多等于由同一系列資料所求得的復相關系數(shù),即一系列資料所求得的復相關系數(shù),即 R123|r123|。2022-3-2532偏相關系數(shù)的顯著性檢驗偏相關系數(shù)的顯著性檢驗偏相關系數(shù)的顯著性檢驗,一般采用偏相關系數(shù)的顯著性檢驗,一般采用t檢驗法。檢驗法。其統(tǒng)計量計算公式為其統(tǒng)計量計算公式為在(在(15)15)式中,式中,r1234mr1234m為偏相關系數(shù),為偏相關系數(shù),n n為為樣本數(shù),樣本數(shù),m m為自變量個數(shù)。為自變量個數(shù)。2022-3-2533對于前述計算得到的偏相關系數(shù)對于前
19、述計算得到的偏相關系數(shù)r2413=0.821,由于由于n=23,m=3,故,故查查t分布表,可得出不同顯著水平上的臨界值分布表,可得出不同顯著水平上的臨界值ta,若若t ta ,則表示偏相關顯著;反之,則表示偏相關顯著;反之,tta,則,則偏相關不顯著。在自由度為偏相關不顯著。在自由度為23-3-1=19時,查表得時,查表得t0.001=3.883,所以,所以tta,這表明在顯著性水平,這表明在顯著性水平a=0.001上,偏相關系數(shù)上,偏相關系數(shù)r2413是顯著的。是顯著的。2022-3-2534年份年份GDPGDP(億元)(億元)人口(萬人)人口(萬人)199019901511.191511
20、.1984248424199119911810.541810.5485348534199219922196.532196.5385808580199319932770.372770.3786208620199419943844.53844.586538653199519954953.354953.3587018701199619965883.85883.887478747199719976537.076537.0788108810199819987021.357021.3588728872199919997493.847493.8489228922200020008337.478337.478
21、9758975200120019195.049195.04902490242002200210275.510275.5906990692003200312078.1512078.15910891082004200415021.8415021.84916391632005200518516.8718516.87921292122006200622077.3622077.36928292822022-3-2535Correlations1.943*.998*.000.000171717.943*1.940*.000.000171717.998*.940*1.000.000.171717Pearso
22、n CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NVAR00001VAR00002VAR00003VAR00001VAR00002VAR00003Correlation is significant at the 0.01 level (2-tailed).*. 2022-3-2536n- - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - Controlling
23、for. 時間時間n GDP 人口人口nGDP 1.0000 -.0690n人口人口 -.0690 1.0000 2022-3-25372.2.復相關系數(shù)的計算與檢驗復相關系數(shù)的計算與檢驗 復相關系數(shù):反映幾個要素與某一個復相關系數(shù):反映幾個要素與某一個要素之間的復相關程度要素之間的復相關程度 。 復相關系數(shù)的計算復相關系數(shù)的計算 當有兩個自變量時當有兩個自變量時 當有三個自變量時當有三個自變量時)1)(1 (11 . 221212.yyyrrR)1)(1)(1 (112. 321 . 2212123.yyyyrrrR2022-3-2538當有當有k個自變量時個自變量時)1 )1)(1 (1)
24、1.(12.21 .2212.12. kykyykyrrrR復相關系數(shù)的性質(zhì)復相關系數(shù)的性質(zhì) 復相關系數(shù)介于復相關系數(shù)介于0到到1之間,即之間,即1012.kyR2022-3-2539 復相關系數(shù)越大,則表明要素(變量)之間復相關系數(shù)越大,則表明要素(變量)之間的相關程度越密切。復相關系數(shù)為的相關程度越密切。復相關系數(shù)為1,表示完,表示完全相關;復相關系數(shù)為全相關;復相關系數(shù)為0,表示完全無關。,表示完全無關。 復相關系數(shù)必大于或至少等于單相關系數(shù)的復相關系數(shù)必大于或至少等于單相關系數(shù)的絕對值。絕對值。復相關系數(shù)的顯著性檢驗復相關系數(shù)的顯著性檢驗 F檢驗法。其統(tǒng)計量計算公式為檢驗法。其統(tǒng)計量計
25、算公式為kknRRFkyky11212.212.2022-3-2540例題:在上例中,若以例題:在上例中,若以x4 4為因變量,為因變量,x1 1,x2 2,x3 3為自變量,試計算為自變量,試計算x4 4與與x1 1,x2 2,x3 3之間的復相之間的復相關系數(shù)。關系數(shù)。 解:按照公式計算解:按照公式計算 檢驗:檢驗: ,故復相關達到,故復相關達到了極顯著水平。了極顯著水平。974.0337.01)(956.01)(579.01 (1)1)(1)(1 (1222212.4321 .42241123.4)rrrR3010. 57190.12001. 0FF2022-3-2541一一 回歸分析的
26、意義及其作用回歸分析的意義及其作用二二 一元回歸模型的建立一元回歸模型的建立三三 多元回歸模型多元回歸模型四四 非線性回歸模型非線性回歸模型第二節(jié)第二節(jié) 地理要素間的地理要素間的相關分析相關分析2022-3-2542一一 回歸分析的意義及其作用回歸分析的意義及其作用(一)回歸分析的概念(一)回歸分析的概念 就是對具有相互聯(lián)系的要素,根據(jù)其就是對具有相互聯(lián)系的要素,根據(jù)其聯(lián)系的形態(tài),選擇一個合適的數(shù)學模式,聯(lián)系的形態(tài),選擇一個合適的數(shù)學模式,用來近似地表達要素間平均變化關系的用來近似地表達要素間平均變化關系的數(shù)理統(tǒng)計方法。這個數(shù)學模式稱為回歸數(shù)理統(tǒng)計方法。這個數(shù)學模式稱為回歸模型(回歸方程)模型
27、(回歸方程)2022-3-2543(三)回歸分析與三)回歸分析與相關分析的區(qū)別與聯(lián)系相關分析的區(qū)別與聯(lián)系 相關分析所研究的變量是對等關系;相關分析所研究的變量是對等關系;回歸分析所研究的兩個變量不是對等關系?;貧w分析所研究的兩個變量不是對等關系。 對兩個變量來說,相關分析只能計算對兩個變量來說,相關分析只能計算出一個相關系數(shù),而回歸分析,可分別建立出一個相關系數(shù),而回歸分析,可分別建立兩個不同的回歸方程。兩個不同的回歸方程。 相關分析要求兩個變量都必須是隨機相關分析要求兩個變量都必須是隨機的,而回歸分析的要求,自變量是給定的,的,而回歸分析的要求,自變量是給定的,因變量是隨機的。因變量是隨機的
28、。2022-3-2544(三)回歸分析研究的主要內(nèi)容三)回歸分析研究的主要內(nèi)容 從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)從一組地理數(shù)據(jù)出發(fā),確定這些要素(變量)間的定量數(shù)學表達式,即回歸模型。間的定量數(shù)學表達式,即回歸模型。 根據(jù)一個或幾個要素(自變量)的值來預測根據(jù)一個或幾個要素(自變量)的值來預測或控制另一個要素(因變量)的取值?;蚩刂屏硪粋€要素(因變量)的取值。 從影響某一地理過程中的許多要素中,找出從影響某一地理過程中的許多要素中,找出哪些要素(變量)是主要的,哪些因素是次要的,哪些要素(變量)是主要的,哪些因素是次要的,這些要素之間又有什么聯(lián)系。這些要素之間又有什么聯(lián)系。 回歸分析研
29、究的地理數(shù)學模型,依要素(變量)的回歸分析研究的地理數(shù)學模型,依要素(變量)的多少可分為一元地理回歸模型和多元地理回歸模型。多少可分為一元地理回歸模型和多元地理回歸模型。2022-3-2545 二二 一元回歸模型的建立一元回歸模型的建立 一元地理回歸所處理的問題,是要解決兩個要素(變量)之間的定量關系。有的是線性關系,有的是非線性關系。因此判斷研究的變量之間的線性與非線性歸屬問題是非常重要的。2022-3-2546(一)一元回歸模型類型的判斷方法(一)一元回歸模型類型的判斷方法 作圖法、作圖法、差分法、曲度法和計算器法等。y = 0.4734x + 0.4241R2 = 0.862202468
30、101202468101214161820222426工業(yè)總產(chǎn)值貨運量2022-3-2547(二)一元線性地理回歸模型的建立(二)一元線性地理回歸模型的建立定義:假設有兩個地理要素(變量)定義:假設有兩個地理要素(變量)x 和和y,x為自變量,為自變量,y為因變量。則一元線性回歸模型為因變量。則一元線性回歸模型的基本結構形式為的基本結構形式為式中:式中:a和和b為待定參數(shù);為待定參數(shù); 為各組觀測數(shù)為各組觀測數(shù)據(jù)的下標;據(jù)的下標; 為隨機變量。為隨機變量。iiibxaye n,1,2,iie2022-3-2548 記記 和和 分別為參數(shù)分別為參數(shù)a與與b的擬合值,的擬合值,則則一元線性回歸模型
31、為一元線性回歸模型為 上式代表上式代表x與與y之間相關關系的擬合直線,之間相關關系的擬合直線,稱為回歸直線;稱為回歸直線; 是是y的估計值,亦稱回歸值。的估計值,亦稱回歸值。a bxbayy 2022-3-2549 參數(shù)a與b的最小二乘擬合原則要求yi與 的誤差ei的平方和達到最小,即niiininiiiibxayyyeQ121122min)()(niiiiniiixbxaybxay110)(0)(iy 1 1、參數(shù)、參數(shù)a、b的最小二乘估計的最小二乘估計 根據(jù)取極值的必要條件,有2022-3-2550niiniiixxxyxxyyxxLLb121)()(xbya2112111)(1)(1ni
32、iniininiiniiiixnxyxnyx 解上述正規(guī)方程組式,得到參數(shù)a與b的擬合值2022-3-2551以課本的例子為例以課本的例子為例( (手算)手算)2 2、具體計算方法、具體計算方法(1 1)將原始數(shù)據(jù)根據(jù)需要列表)將原始數(shù)據(jù)根據(jù)需要列表(2 2)根據(jù)公式計算)根據(jù)公式計算b b(3 3)計算)計算a a(4 4)寫出回歸模型)寫出回歸模型(5 5)一般情況下還要求出相關系數(shù))一般情況下還要求出相關系數(shù)2022-3-2552用用ExcelExcel建立回歸模型及其進行預測建立回歸模型及其進行預測(1 1)確定變量,建立數(shù)據(jù)庫)確定變量,建立數(shù)據(jù)庫(2 2)作圖,選擇散點圖)作圖,選
33、擇散點圖(3 3)圖完成后,點擊圖表,然后點擊)圖完成后,點擊圖表,然后點擊添加趨勢線,選擇線性方程;然后點擊添加趨勢線,選擇線性方程;然后點擊選項,在選項欄中點中顯示公式和相關選項,在選項欄中點中顯示公式和相關系數(shù)的平方。系數(shù)的平方。2022-3-2553(4 4)對圖進行修飾)對圖進行修飾(5 5)利用建立的回歸方程,可以對原)利用建立的回歸方程,可以對原始數(shù)據(jù)進行遞推,檢驗誤差;同時可以始數(shù)據(jù)進行遞推,檢驗誤差;同時可以對未來的趨勢進行預測。對未來的趨勢進行預測。用用ExcelExcel建立回歸模型及其進行預測建立回歸模型及其進行預測2022-3-2554年份 耕地面積 年份 耕地面積
34、1985 4604.03 1990 4557.86 1986 4590.79 1991 4549.97 1987 4579.81 1992 4521.77 1988 4568.84 1993 4495.66 1989 4562.32 1994 4464.00 江蘇省江蘇省1985198519941994年耕地面積年耕地面積利用所給數(shù)據(jù):利用所給數(shù)據(jù):(1 1)建立江蘇省耕地面積與時間的回歸模型)建立江蘇省耕地面積與時間的回歸模型(2 2)計算耕地面積與時間的相關系數(shù))計算耕地面積與時間的相關系數(shù)(3 3)并預測)并預測20102010年江蘇耕地面積年江蘇耕地面積2022-3-2555y = -
35、13.803x + 32010R2 = 0.914744404460448045004520454045604580460046201984198619881990199219941996耕地面積(千公頃)耕地面積線性 (耕地面積)32010803.13xy 將將20102010帶入上述方程中,可以求得帶入上述方程中,可以求得20102010年年江蘇省耕地面積江蘇省耕地面積2022-3-2556 方法:方法:F F 檢驗法。檢驗法。 總的離差平方和:在回歸分析中,表示總的離差平方和:在回歸分析中,表示y y的的n n次次觀測值之間的差異,記為觀測值之間的差異,記為 可以證明可以證明niiyyy
36、yLS12)(總niiyyyyLS12)(總niniiiiUQyyyy1122)()(3、一元線性回歸模型的顯著性檢驗、一元線性回歸模型的顯著性檢驗2022-3-2557 在上式中,在上式中,Q稱為誤差平方和,或剩余平方和稱為誤差平方和,或剩余平方和 而而 稱為回歸平方和。稱為回歸平方和。niiiyyQ12)(xyxxniiniiniiibLLbxxbxbabxayyU21221212)()()(2022-3-2558 統(tǒng)計量F F越大,模型的效果越佳。統(tǒng)計量FF(1,n-2)。在顯著水平下,若FF,則認為回歸方程效果在此水平下顯著。一般地,當FF0.10(1,n-2)時,則認為方程效果不明顯
37、。 2nQUF2022-3-2559變差來源平方和自由度方差F回歸(因素回歸(因素x x)1S2uU/1剩余(隨機因剩余(隨機因素)素)n2S2QQ/n-2總和總和n-121)(yyUnii21)(iniiyyQ21)(yylSiniyy總)2/(1/nQUF2022-3-25604、利用回歸模型進行預測、利用回歸模型進行預測 對所建立的回歸模型經(jīng)過檢驗效果顯著時,便可以利用回歸模型進行地理預測。 所謂地理預測就是利用建立的回歸模型,在給出一定信度條件下,求出在 的水平上預測y值的出現(xiàn)范圍(或預測區(qū)間)。具體例子見課本。具體例子見課本。2022-3-2561 例:某地人口隨著時間的推移而呈線性
38、增加,利用所給數(shù)據(jù)例:某地人口隨著時間的推移而呈線性增加,利用所給數(shù)據(jù)1.寫出寫出a、b的計算公式的計算公式2.寫出回歸模型,并計算相關系數(shù)和進行寫出回歸模型,并計算相關系數(shù)和進行F檢驗檢驗3.并分別預測該地并分別預測該地2010年和年和2020年的人口數(shù)年的人口數(shù)時間20002001200220032004人口(萬人)246892022-3-2562三、多元線性回歸模型回歸模型的建立回歸模型的建立 多元線性回歸模型的結構形式為 aakaaaxxxyk22110 式中: 為待定參數(shù); 為隨機變量。 k,10a2022-3-2563 回歸方程: 如果 分別為上式中 的擬和值,則回歸方程為 在上式
39、中,b0為常數(shù),b1,b2,bk稱為偏回歸系數(shù)。偏回歸系數(shù)的意義是,當其他自變量都固定時,自變量 每變化一個單位而使因變量平均改變的數(shù)值。kkxbxbxbby22110kbbb,10k,210ix2022-3-2564 偏回歸系數(shù)的推導過程:根據(jù)最小二乘法原理, 的估計值 應該使 由求極值的必要條件得 方程組式經(jīng)展開整理后得 min)()(122211012nakakaaanaaaxbxbxbbyyyQ), 2, 1(0)(20)(2110kjxyybQyybQnajaaajnaaa), 2 , 1 , 0(kii)(k,1,2, 0iib2022-3-2565 方程組式稱為正規(guī)方程組。 引入
40、矩陣nanaakanakkanakaakaanakananaaanakkaanaaaanaananaaanakkaanaaanaananaanakkanaaayxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb11122121101112122122121012111112121121011111212110)(.)()()()()()()()()()()()()()(2022-3-2566knnnkkxxxxxxxxxxxxX2132313222121k211111.11knnnkkkknkkknnTxxxxxxxxxxxxxxxxxxxxxxxxXXA
41、2132313222121211132122322211131211111111112022-3-2567nakanakaanakaanakanakaanaanaaanaanakaanaaananaanakanaanaaxxxxxxxxxxxxxxxxxxxxxn12121111212212112111211211111211nyyyY21nbbbbb2102022-3-2568 則正規(guī)方程組式可以進一步寫成矩陣形式BAb naakanaaanaaanaanknkkknnTyyyxyxyyyyyxxxxxxxxxxxxYXB1121113213212232221113121111112022-
42、3-2569求解得引入記號 YXXXBAbTT11)(najjiiajiijxxxxLL1)(naaiiaiyyyxxL1)(),2, 1,(kji),2,1(ki2022-3-2570正規(guī)方程組也可以寫成kkkykkkkkykkykkxbxbxbybLbLbLbLLbLbLbLLbLbLbL2211022112222212111212111)51 . 2 . 3( 2022-3-2571n回歸模型的顯著性檢驗回歸模型的顯著性檢驗 回歸平方和U與剩余平方和Q: 回歸平方和 剩余平方和為 F統(tǒng)計量為 計算出來F之后,可以查F分布表對模型進行顯著性檢驗。k21x,x,xQULSyy總nanaiyi
43、LbyyU112)(nayyaaULyyQ12)()1/(/knQkUF2022-3-2572四四 非線性回歸模型的建立非線性回歸模型的建立 在許多實際地理問題中,有時變量之在許多實際地理問題中,有時變量之間的關系并不是線性的,而是某種非線間的關系并不是線性的,而是某種非線性,這時就需要選配適當類型的曲線,性,這時就需要選配適當類型的曲線,近似地表達兩要素之間的平均變化關系。近似地表達兩要素之間的平均變化關系。2022-3-2573非線性關系線性化的幾種情況非線性關系線性化的幾種情況對于指數(shù)曲線 ,令 , 可以將其轉(zhuǎn)化為直線形式: , 其中, ; 對于對數(shù)曲線 ,令 , ,可以將其轉(zhuǎn)化為直線形
44、式: ;對于冪函數(shù)曲線 ,令 , ,可以將其轉(zhuǎn)化為直線形式: 其中, ; bxdyexbayxbaylnxbaybdxy xbayyylnxx dalnyy xxlnyylnxxlndaln2022-3-2574對于雙曲線 ,令 ,轉(zhuǎn)化為直線形式: ; 對于S型曲線 ,可 轉(zhuǎn)化為直線形式: ; 對于冪乘積 ,只要令 ,就可以將其轉(zhuǎn)化為線性形式 其中, ;xbay1xbayxxxyybaye,1,e1令xbaykkxxdxy2121kkxxxy22110 xxyy1,1kkxxxxxxyyln,ln,ln,ln2211dln02022-3-2575對于對數(shù)函數(shù)和 只要令 ,就可以將其化為線性形式
45、 例例: :表3.2.1給出了某地區(qū)林地景觀斑塊面積(area)與周長(perimeter)的數(shù)據(jù)。下面我們建立林地景觀斑塊面積A與周長P之間的非線性回歸模型 。 kkxxxylnlnln22110kkxxxy22110kkxxxxxxyyln,ln,ln,22112022-3-2576 序號面積A周長P序號面積A周長P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7124430 833.840895.98049 442.902530.202451 823.3
46、55205.131510 858.9201 906.1034626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.195243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921522 038.617320.396122 372.105199.667533 432.137
47、253.335138 390.633592.893541 600.391230.030146 003.719459.467553 867.586419.406表3.2.1 某地區(qū)各個林地景觀斑塊面積(m2)與周長(m) 2022-3-257715527 620.2006 545.291561 946.184198.66116179 686.2002 960.4755777.30556.9021714 196.460597.993587 977.719715.7521822 809.1801 103.0705919 271.8201 011.1271971 195.9401 154.118608
48、 263.480680.710203 064.242245.049 6114 697.1301 234.1142146 9416.7008 226.009624 519.867326.317225 738.953498.6566313 157.6601 172.916238 359.465415.151646 617.270609.801246 205.016414.790 654 064.137437.355256 0619.0201 549.871665 645.820432.355261 4517.740791.943676 993.355503.7842731 020.1001 700
49、.965684 304.281267.9512826 447.1601 246.977696 336.383347.136297 985.926918.312702 651.414292.2352022-3-2578303 638.766399.725712 656.824298.4733158 5425.10011 474.770721 846.988179.8663235 220.6401 877.476731 616.684172.8083310 067.820497.394741 730.563172.1433427 422.5701 934.5967511 303.970881.04
50、23543 071.5501 171.4137614 019.790638.1763657 585.9402 275.389779 277.172862.0883728 254.1301 322.7957813 684.750712.78738497 261.0009 581.298791 949.164228.4033924 255.030994.906804 846.016324.481401 837.699229.40181521 457.4007 393.938411 608.625225.84282564 370.80012 212.4102022-3-2579 解解:(1)作變量替
51、換,令:)作變量替換,令: , ,將表,將表3.2.13.2.1中的原始中的原始數(shù)據(jù)進行對數(shù)變換,變換后得到的各新變量對應的觀測數(shù)據(jù)如表數(shù)據(jù)進行對數(shù)變換,變換后得到的各新變量對應的觀測數(shù)據(jù)如表3.2.23.2.2所示。所示。 AylnPxln序號y=lnAx=LnP序號y=lnAx=LnP1 9.254 1066.438 3794212.358 138.362 1862 9.678 7636.417 243 8.307 6225.667 487310.340 996.653 7824410.336 376.797 9184 9.153 0196.273 258457.508 4335.323
52、655 9.292 7427.552 8164610.176 196.875 2946 9.977 3387.168 551479.515 9096.951 8417 8.838 076.033 2264811.091 187.718 8798 8.214 7895.496 7894911.965 727.786 3649 7.723 25.284 414507.643 2085.585 52810 5.812 1354.602 457518.042 0795.567 65111 9.371 536.326 008527.620 0275.7695 58表3.2.2 經(jīng)對數(shù)變換后的數(shù)據(jù)2022-3-2580127.771 5335.296 653538.140 9385.534 711139.034 8716.385 013547.378 0035.438 211148.700 1346.130 066558.260 3866.038 8391513.176 138.786 501567.573 6265.291 5971612.098 977.993 105574.347 7554.041 328179.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理病房管理
- 盜血綜合征的護理措施
- 珠寶店管理層培訓心得
- 巧設問題情境 點燃思維火花
- 人員培訓定人定崗分層管理
- 員工基礎技能培訓
- 呼吸內(nèi)科體格檢查
- 水利設施測繪成果保密與工程管理合同
- 創(chuàng)新型餐飲企業(yè)勞動合同規(guī)范模板
- 非洲勞務派遣與醫(yī)療援助合同
- 穩(wěn)定幣技術挑戰(zhàn)-洞察分析
- 校園食堂升級服務方案
- 沐足行業(yè)嚴禁黃賭毒承諾書
- 2024年初級招標采購從業(yè)人員《招標采購法律法規(guī)》考前通關必練題庫(含答案)
- 2.10豐巢智能柜合作協(xié)議
- 15.1兩種電荷 - 2024-2025學年人教版初中物理九年級全一冊
- 分布式光伏發(fā)電項目EPC總承包投標方案(技術方案)
- 2023-2024學年天津市部分區(qū)高一下學期期末考試化學試卷 (解析版)
- 2024-2030年中國伊利石行業(yè)經(jīng)銷模式及競爭策略展望分析報告版
- 2024年安順市普定縣引進高層次人才招考易考易錯模擬試題(共500題)試卷后附參考答案
- 【課件】動詞的時態(tài)、語態(tài)和主謂一致 課件-2025屆高三英語上學期一輪復習專項
評論
0/150
提交評論