基于R的群落學多元統計分析_第1頁
基于R的群落學多元統計分析_第2頁
基于R的群落學多元統計分析_第3頁
基于R的群落學多元統計分析_第4頁
基于R的群落學多元統計分析_第5頁
已閱讀5頁,還剩60頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1基于 的群落多元統計分析 用vegan包進行排序分析賴江山(janson) 中國科學院植物研究所2010. 11.52vegan軟件包簡介軟件包簡介3vegan是是Vegetation analysis的縮寫的縮寫,是群落分析的是群落分析的package作者:作者:Jari Oksanen /web/packages/vegan/index.htmlhttp:/cc.oulu.fi/jarioksa/softhelp/vegan.htmllibrary(vegan)什么是排序什么是排序(ordination)?排序的過程是將樣方或植物種排列在一

2、定的空間,排序的過程是將樣方或植物種排列在一定的空間,使得排序軸能夠反映一定的生態梯度,從而,能使得排序軸能夠反映一定的生態梯度,從而,能夠解釋植被或植物種的分布與環境因子間的關系,夠解釋植被或植物種的分布與環境因子間的關系,也就是說排序是為了揭示植被也就是說排序是為了揭示植被-環境間的生態關系。環境間的生態關系。因此,排序也叫梯度分析(因此,排序也叫梯度分析(gradient analysis)。)。間接梯度分析間接梯度分析 (Indirect gradient analysis)直接梯度分析直接梯度分析 (direct gradient analysis)2個種的排序圖個種的排序圖3個種的

3、排序圖個種的排序圖4個種的排序圖?個種的排序圖?40個種排序圖?個種排序圖?基礎知識、三相交流電: 由三個頻率相同、電勢振幅相等、相位差互差 120 角的交流電路組成的電力系統,叫三相交流電。 、一次設備: 直接與生產電能和輸配電有關的設備稱為一次設備。包括各種高壓斷路器、隔離開關、母線、電力電纜、電壓互感器、電流互感器、電抗器、避雷器、消弧線圈、并聯電容器及高壓熔斷器等。 基礎知識、二次設備: 對一次設備進行監視、測量、操縱控制和保護作用的輔助設備。如各種繼電器、信號裝置、測量儀表、錄波記錄裝置以及遙測、遙信裝置和各種控制電纜、小母線等。 4、負荷開關: 負荷開關的構造與隔離開關相似,只是加

4、裝了簡單的滅弧裝置。它也是有一個明顯的斷開點,有一定的斷流能力,可以帶負荷操作,但不能直接斷開短路電流,如果需要,要依靠與它串接的高壓熔斷器來實現。 排序的目標:排序的目標:1.降低維數,減少坐標軸的數目降低維數,減少坐標軸的數目 ;2. 由降低維數引起的信息損失盡量少,即發生最由降低維數引起的信息損失盡量少,即發生最小的畸變,也就是讓新的坐標系第小的畸變,也就是讓新的坐標系第1-3軸排序軸包軸排序軸包含大量的生態信息含大量的生態信息 。排序的目的:排序的目的:表示植被與環境之間的關系:表示植被與環境之間的關系:所有排序方法都反映植物種和環境之間的關系以所有排序方法都反映植物種和環境之間的關系

5、以及在某一環境梯度上的種間關系。及在某一環境梯度上的種間關系。 線形模型(線形模型(linear model),短的梯度,主成分),短的梯度,主成分分析(分析(Principle component analysis),需要對數據,需要對數據進行非線性轉換,如取對數;進行非線性轉換,如取對數;1.非線性模型(非線性模型(non-linear model)如高斯模型,)如高斯模型,長的梯度,對應分析長的梯度,對應分析 (Correspondence analysis) 群落數據輸入群落數據輸入gtsdata=read.table(gtsdata.txt,header=T)gtsdatadim(g

6、tsdata)環境因子數據輸入環境因子數據輸入gtsenv=read.table(gtsenv.txt,header=T); gtsenvdim(gtsenv)數據的標準化數據的標準化1. decostand(x, method, MARGIN, )total: 除以行和或列和除以行和或列和 (default MARGIN = 1是是row);max:除以行或列的最大值除以行或列的最大值(default MARGIN = 2 是列是列);freq:除以行或列的最大值除以行或列的最大值,并乘以非零值的個數,非零值的平并乘以非零值的個數,非零值的平均值為均值為1 (default MARGIN=2

7、);normalize:使行或列的平方和等于使行或列的平方和等于1 (default MARGIN = 1);range: 標準化使行或列的值在標準化使行或列的值在0 . 1 (default MARGIN = 2).standardize:標準化使行或列的和為標準化使行或列的和為1且方差為且方差為1(default MARGIN = 2);pa: 將數據轉換為將數據轉換為0、1數據;數據; chi.square: 除以行和及列和的平方根;除以行和及列和的平方根;hellinger: 采用采用total標準化以后再取平方根;標準化以后再取平方根;log:對數化,默認自然對數,對數化,默認自然對

8、數,logbase參數是自選的參數是自選的base2. wisconsin(x) :除以列最大值,再除以行和。除以列最大值,再除以行和。排序類別排序類別(in CANOCO)間接梯度分析(間接梯度分析(Indirect Gradient Analysis) :PCA (Principal components analysis)CA (Correspondence analysis)DCA (Detrended Correspondence Analysis)直接梯度分析(直接梯度分析(Direct Gradient Analysis) :RDA (Redundance analysis)CC

9、A (Canonical correspondence analysis)DCCA (Detrended CCA )PCA RDA CA CCA DCA DCCA15決定排序的模型:單峰還是線性?決定排序的模型:單峰還是線性?decorana(gtsdata)Call:decorana(veg = gtsdata) Detrended correspondence analysis with 26 segments.Rescaling of axes with 4 iterations. DCA1 DCA2 DCA3 DCA4Eigenvalues 0.3939 0.2239 0.09555

10、0.06226Decorana values 0.5025 0.1756 0.06712 0.03877Axis lengths 3.2595 2.5130 1.21445 1.00854如果這四個軸中梯度最長(最大值)超過4,選擇單峰模型排序(CA、CCA、DCA)更合適。如果是小于3,選擇線性模型(PCA、RDA)比較合理。如果介于3-4之間,單峰模型和線性模型結果差不多。間接梯度分析間接梯度分析(Indirect Gradient Analysis)PCA (Principal components analysis)CA (Correspondence analysis)DCA (De

11、trended Correspondence Analysis)主成分分析主成分分析(Principle component analysis, PCA)主成分分析的主要原主成分分析的主要原理是:理是:使坐標旋轉一定的角使坐標旋轉一定的角度后,使第一軸表示數度后,使第一軸表示數據最大的方差,使第二據最大的方差,使第二軸表示數據第二的方差。軸表示數據第二的方差。而且軸與軸之間是正交而且軸與軸之間是正交的(的(orthogonal)。-4-2024-4-2024 PCA和和RDA都采用函數都采用函數rda實現:實現:在在vegan包中,包中,rda(formula, data, scale=FAL

12、SE, .) rda(X, Y, Z, scale=FALSE, .) scores(x, choices, display=c(sites,species), .) 在在stat包中:包中:princomp(x, .) 主成分分析主成分分析princomp(formula, data = NULL, subset, na.action, .) gts.rda=rda(gtsdata)gts.rdaCall: rda(X = gtsdata) Inertia RankTotal 352.1 Unconstrained 352.1 22Inertia is variance Eigenvalue

13、s for unconstrained axes: PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 111.779 73.580 54.607 32.959 26.481 18.063 12.763 7.637 scores(gts.rda,choices=c(1:4) ,display=c(si,sp)summary(gts.rda) #類似類似Canoco的的log文件和文件和.sol文件的信息文件的信息plot(gts.rda,choices=c(1,2),display=c(sp,si)biplot(gts.rda,choices=c(1,2),display=c(sp

14、,si)plot(rda(gtsdata,scale=T)plot(rda(gtsdata)!如果不對數據做標準化的話,豐富種的值就非常大,排序如果不對數據做標準化的話,豐富種的值就非常大,排序時就只能看清豐富種的位置,其它種就擁擠在一起。時就只能看清豐富種的位置,其它種就擁擠在一起。 如用如用x x1 1, ,x x2 2, ,x x3 3, ,x x4 4, ,x x5 5, ,x x66分別表示原先的變分別表示原先的變量,而用量,而用y y1 1, ,y y2 2, ,y y3 3, ,y y4 4, ,y y5 5, ,y y66表示新的主成表示新的主成分,那么,第一和第二主成分為分,

15、那么,第一和第二主成分為11234562123456-0.806-0.674-0.6750.8930.8250.8360.3530.5310.5130.3060.4350.425yxxxxxxyxxxxxx 這些系數稱為主成分載荷(這些系數稱為主成分載荷(loading),它表示),它表示主成分和相應的原先變量的相關系數。比如主成分和相應的原先變量的相關系數。比如y1表表示式中示式中x1的系數為的系數為-0.806,這就是說第一主成分,這就是說第一主成分和的和的x x1 1變量的相關系數為變量的相關系數為-0.806。相關系數。相關系數(絕對絕對值)越大,主成分對該變量的代表性也越大。值)越大

16、,主成分對該變量的代表性也越大。負荷負荷(loading)gts.pca=princomp(gtsdata)gts.pca$loadingsgtsenv.pca=princomp(gtsdenv)gtsenv.pca$loadingsbiplot(gtsenv.pca) 第一主成分代表海拔高度,第二第一主成分代表海拔高度,第二主成分代表坡向主成分代表坡向對應分析對應分析(Correspondence analysis, CA) PCA在迭代運算過程是采用線性模型在迭代運算過程是采用線性模型1.CA在迭代運算過程采用單峰模型(加權平均法)在迭代運算過程采用單峰模型(加權平均法)CA在在vegan

17、中也是用中也是用cca函數來實現:函數來實現:gts.ca=cca(gtsdata)gts.casummary(gts.ca)Call:cca(X = gtsdata) Inertia RankTotal 1.424 Unconstrained 1.424 21Inertia is mean squared contingency coefficient Eigenvalues for unconstrained axes: CA1 CA2 CA3 CA4 CA5 CA6 CA7 CA8 0.50253 0.26564 0.14023 0.10502 0.09127 0.05540 0.050

18、63 0.04204 28plot(gts.ca)CANOCO里面 scaling of ordination scores29plot(gts.ca, scaling=1)用物種數據對樣方坐標進行加權平均用物種數據對樣方坐標進行加權平均,使樣方坐使樣方坐標在物種數據的中心,因此對樣方感興趣的話,標在物種數據的中心,因此對樣方感興趣的話,采用這種做圖方法。采用這種做圖方法。plot(gts.ca, scaling=2)plot(gts.ca, scaling=3)用樣方數據對物種坐標進行加權平均用樣方數據對物種坐標進行加權平均,使物種數使物種數據在樣方數據的中心,因此對物種感興趣的話,據在樣方

19、數據的中心,因此對物種感興趣的話,采用這種做圖方法。采用這種做圖方法。如果一個物種靠近某個樣方,表明該物種可能對如果一個物種靠近某個樣方,表明該物種可能對該樣方的位置起很大的作用。特別是對于二元數該樣方的位置起很大的作用。特別是對于二元數據的排序,這個樣方可能就代表該物種。據的排序,這個樣方可能就代表該物種。如圖中,如圖中,20號樣方號樣方與短柄枹與短柄枹(QUESER)靠得比較近,表明:靠得比較近,表明:短柄枹表征了短柄枹表征了20號號樣方的特征,樣方的特征,19號號樣方與樣方與20號樣方距號樣方距離近,生態關系也離近,生態關系也較近。較近。 只在少數樣方出現的物只在少數樣方出現的物種通常在

20、排序空間的邊緣,種通常在排序空間的邊緣,表明它們只偶然發生,或表明它們只偶然發生,或它們只在稀有生境(如米它們只在稀有生境(如米櫧櫧CASCAR)。)。 在排序空間中心的物種,在排序空間中心的物種,可能在取樣區域是該物種可能在取樣區域是該物種最優分布區,如甜櫧,或最優分布區,如甜櫧,或有兩個或多個最優分布區,有兩個或多個最優分布區,或與前兩個軸不相關。或與前兩個軸不相關。除趨勢對應分析除趨勢對應分析(Detrended correspondence analysis, DCA):CA采用單峰曲線表示物種和環境關系采用單峰曲線表示物種和環境關系CA產生的弓形效應產生的弓形效應CA的第二排序軸在的

21、第二排序軸在許多情況下是第一許多情況下是第一軸的二次變形,即軸的二次變形,即所謂的所謂的“弓形效應弓形效應”(Arch effect)或)或者者“馬蹄形效應馬蹄形效應”(horse-shoe effect)。)。 (詳見張金屯群落生態學168頁) 和分別代表除趨勢前和除趨勢后的樣方排序(引自Hill 和Gauch 1980)DCA在在R中的實現采用函數中的實現采用函數decorana。decorana(veg, iweigh=0, iresc=4, ira=0, mk=26, short=0, before=NULL, after=NULL) veg:群落數據群落數據;iweig:稀有物種的權

22、重;稀有物種的權重;(稀有物種影響比較大)稀有物種影響比較大)iresc:糾正弓形效應的次數;:糾正弓形效應的次數;ira:分析的類型分析的類型(DCA:0 , CA:1);mk:校正弓形效應軸的分段數:校正弓形效應軸的分段數;short: 需要校正的最短梯度。需要校正的最短梯度。plot(decorana(gtsdata)plot(cca(gtsdata)直接梯度分析(直接梯度分析(Direct Gradient Analysis) :RDA (Redundance analysis)CCA (Canonical correspondence analysis)pRDA (partial R

23、DA)pCCA (partial CCA)冗余分析冗余分析(redundancy analysis, RDA)及典范對應分析(及典范對應分析(Canonical correspondence analysis, CCA)1.通常采用通常采用PCA處理環境數據,采用處理環境數據,采用CA處理群落處理群落數據,但這些方法都只能處理一個數據表;數據,但這些方法都只能處理一個數據表;2.RDA和和CCA是多元分析(是多元分析(PCA,CA)和線性)和線性回歸的結合,研究植被和環境之間的關系。回歸的結合,研究植被和環境之間的關系。40 當我們在解釋變量(環境因子數據)與響應變量(物種數據)之間建立預測模

24、型的時候,經常會遇到這樣的情況,往往我們僅僅考察解釋變量中某幾個環境因子的對物種數據的影響,但剩下的環境因子也會對物種產生影響,這些剩余環境因子我們經常稱為協變量(Covariables) 。在CANOCO中,協變量的影響可以用偏分析(partial analyze)剔除出來。 實際上,任何一個環境因子變量均可以成為協變量。例如,我們要研究管理模式對蝴蝶群落中組成的影響,我們可以在不同的海拔地點取樣,海拔也許對群落物種組成影響很大,但此時我們感興趣的是管理模式的影響,而非海拔梯度的影響。這個時候,如果能剔除出海拔的影響,我們能管理模型與蝴蝶種群之間更清晰的關系。 摘自 第一章6pPCA與環境因

25、子結合是與環境因子結合是RDA,CA與環境因子結與環境因子結合是合是CCA。RDA在在vegan中的實現:中的實現:rda(formula, data, .) rda(X, Y, Z, .) CCA在在vegan中的實現:中的實現:cca(formula, data, .) cca(X, Y, Z, .)gts.rda=rda(gtsdata,gtsenv);gts.rda=rda(gtsdataelev+convex+slope+aspect+N+K+P+pH,data=gtsenv);summary(gts.rda)plot(gts.rda)gts.prda=rda(gtsdata,gts

26、env,1:4, gtsenv,5:8)summary(gts.prda)plot(gts.prda)plot(gts.rda)環境因子一般用箭頭表環境因子一般用箭頭表示,箭頭所處的象限表示,箭頭所處的象限表示環境因子與排序軸間示環境因子與排序軸間的正負相關性,箭頭連的正負相關性,箭頭連線的長度代表著某個環線的長度代表著某個環境因子與群落分布和種境因子與群落分布和種類分布間相關程度的大類分布間相關程度的大小,連線越長,說有相小,連線越長,說有相關性越大。反之越小。關性越大。反之越小。箭頭連線和排序軸的夾箭頭連線和排序軸的夾角代表著某個環境因子角代表著某個環境因子與排序軸的相關性大小,與排序軸的

27、相關性大小,夾角越小,相關性越高;夾角越小,相關性越高;反之越低。反之越低。 gts.cca=cca(gtsdata,gtsenv);gts.cca=cca(gtsdataelev+convex+slope+aspect+N+K+P+pH,data=gtsenv) summary(gts.cca)plot(gts.cca)gts.pcca=cca(gtsdata,gtsenv,1:4, gtsenv,5:8)summary(gts.pcca)plot(gts.pcca)plot(gts.cca)RDARDA和和CCACCA結果的檢驗:結果的檢驗:goodness(object, display

28、 = c(“species”, “sites”), choices, model = c(“CCA”, “CA”), statistic = c(“explained”, “distance”), summarize = FALSE, .) :物種或樣方與軸累計解釋量;:物種或樣方與軸累計解釋量;【Cumulative fit per species as fraction of variance of species】in CANOCOinertcomp(object, display = c(“species”, “sites”), statistic = c(“explained”, “

29、distance”), proportional = FALSE) :物種或樣方的方差分解分析;:物種或樣方的方差分解分析;spenvcor(object) :物種和環境的相關分析物種和環境的相關分析;intersetcor(object) :環境因子和各軸的相關分析;環境因子和各軸的相關分析;最好使用:最好使用:envfit;vif.cca(object) :方差膨脹因子分析;方差膨脹因子分析;RDARDA和和CCACCA結果的檢驗:結果的檢驗:envfit(X, P, permutations = 0, strata, choices=c(1,2), .) envfit(formula,

30、data, .) gts.cca=cca(gtsdata,gtsenv)ef=envfit(gts.cca,gtsenv,permu=1000)CCA1 CCA2 r2 Pr(r) elev -0.9999873 -0.0050479 0.5005 0.001 *convex -0.7746504 0.6323898 0.0844 0.28 slope 0.1526685 0.9882775 0.5296 0.001 *aspect -0.1364818 -0.9906426 0.0169 0.82 N 0.6878942 0.7258110 0.6342 0.001 *P 0.8101502

31、 0.5862224 0.5856 0.001 *K 0.6004984 0.7996260 0.3364 0.001 *pH -0.1929061 -0.9812172 0.6313 goodness(gts.cca,display=“sp”)inertcomp(gts.cca, proportional = T) spenvcor(gts.cca) intersetcor(gts.cca) vif.cca(gts.cca) RDARDA和和CCACCA模型的選擇:模型的選擇: step(mod1,scope)mod1=cca(gtsdata1,data=gtsenv);mod2=cca(g

32、tsdataelev+convex+slope+aspect+P+N+K+pH,data=gtsenv);mod=step(mod1,scope=(list(lower=formula(mod1),upper=formula(mod2);Start: AIC=180.2gtsdata 1 Df AIC+ P 1 174.66+ elev 1 174.67+ N 1 174.89+ pH 1 176.95+ slope 1 177.82+ K 1 178.14 180.20+ convex 1 180.85+ aspect 1 181.53RDARDA和和CCACCA結果的檢驗:結果的檢驗: g

33、ts.cca=cca(gtsdataelev+convex+slope+aspect+P+N+K+pH,data=gtsenv)anova(gts.cca)anova(gts.cca,by=“axis”)anova(gts.cca,by=“terms”)Model: cca(formula = gtsdata elev + convex + slope + aspect + P + N + K + pH, data = gtsenv) Df Chisq F N.Perm Pr(F) elev 1 0.2446 7.0228 100 0.01 *convex 1 0.0624 1.7902 10

34、0 0.07 . slope 1 0.1356 3.8928 100 0.01 *aspect 1 0.0208 0.5981 100 0.55 P 1 0.0911 2.6159 100 modCall:cca(formula = gtsdata P + pH + elev + convex, data = gtsenv) Inertia RankTotal 1.4243 Constrained 0.5640 4Unconstrained 0.8603 21Inertia is mean squared contingency coefficient Eigenvalues for cons

35、trained axes: CCA1 CCA2 CCA3 CCA4 0.31595 0.18030 0.04863 0.01913 Eigenvalues for unconstrained axes: CA1 CA2 CA3 CA4 CA5 CA6 CA7 CA8 0.27067 0.13398 0.08373 0.06294 0.05026 0.04852 0.04199 0.02758 作圖函數:作圖函數:plot(x, choices = c(1, 2), display = c(sp, wa, cn), scaling = 2, type, xlim, ylim, .) x: cca

36、或或rda分析結果;分析結果;choices:選擇的軸;選擇的軸;display:顯示的類型,顯示的類型,sp,物種,物種,wa,樣方,樣方,lc, 線性結合的樣方坐標線性結合的樣方坐標;作圖函數:作圖函數:text(x, display = sites, labels, choices = c(1, 2), scaling = 2, arrow.mul, head.arrow = 0.05, select, .)x: cca或或rda分析結果;分析結果;display:顯示的類型,顯示的類型,sp,wa, lc,bp,環境因環境因子子;cn,中心化后的環境因子;中心化后的環境因子;label

37、:用來替代箭頭的字符;用來替代箭頭的字符;Arrow.mul:環境因子放大倍數環境因子放大倍數;作圖函數作圖函數:points(x, display = sites, choices = c(1, 2), scaling = 2, arrow.mul, head.arrow = 0.05, select, .)plot(gts.cca,type=n);text(gts.cca,display=“cn”,arrow.mul=1.5,col=4); points(gts.cca,display=lc,pch=16,col=2,select=1:20)points(gts.cca,display=“

38、lc”,pch=2,col=4,select=21:40)text(gts.cca,display=“lc”,col=4”);繪制三維排序圖:繪制三維排序圖:ordiplot3d(object, display = sites, choices = 1:3, ax.col = 2, arr.len = 0.1, arr.col = 4, envfit, xlab, ylab, zlab, .) ordirgl(object, display = sites, choices = 1:3, type = p, ax.col = red, arr.col = yellow, text, envfi

39、t, .) orglpoints(object, display = sites, choices = 1:3, .) orgltext(object, text, display = sites, choices = 1:3, justify = center, adj = 0.5, .) ordiplot3d(gts.cca,type=“h”) ordirgl(gts.cca,type=p) 繪制環境因子梯度圖:繪制環境因子梯度圖:ordisurf(x, y, choices=c(1, 2), knots=10, family=gaussian, col=red, thinplate = TRUE, add = FALSE, display = sites, w =

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論