




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
定義(dìngyì):現實世界中大多數現象表現相關關系,人們通過的大量觀察,將現象之間的相關關系抽象概括為函數關系,并用函數形式或模型來描述與推斷現象間的具體變動關系,用一或一組變量(biànliàng)的變化來估計與推算另一變量(biànliàng)的變化。這種分析方法成為回歸分析。精品資料依據要素(yàosù)分類
一元線性回歸分析一元回歸分析冪函數一元非線性回歸分析指數函數多元(duōyuán)線性回歸分析對數函數多元(duōyuán)回歸分析冪函數多元(duōyuán)非線性回歸分析指數函數對數函數
精品資料回歸分析的主要(zhǔyào)內容:①從一組數據出發,確定某些變量之間的定量關系式,即建立數學模型并估計其中的未知參數。估計參數的常用方法是最小二乘法。②對這些關系式的可信程度進行檢驗。③在許多自變量共同影響著一個因變量的關系中,判斷(pànduàn)哪個(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關系式對某一生產過程進行預測或控制。回歸分析的應用是非常廣泛的,統計軟件包使各種回歸方法計算十分方便。精品資料線性回歸(huíguī)的局限性:不應該使用(shǐyòng)這種方法來預測和建立模型時所使用(shǐyòng)的數據值相關差甚遠的值。避免模型中自變量之間有較高的相關性。對噪聲數據敏感。一般假設誤差變量(
errorvariances或residuals)服從均值為0的正態分布。精品資料回歸(huíguī)分析在地理學中的意義和作用:
主要研究地理系統各要素之間相互關系(guānxì),尋找出隱藏在隨機性后面的統計規律。
有預測地理中要素的變化趨勢。
精品資料回歸分析(fēnxī)的一般步驟精品資料涉及一個自變量的回歸;因變量y與自變量x之間為線性關系(guānxì);因變量(dependentvariable):被預測或被解釋的變量,用y表示。自變量(independentvariable):預測或解釋因變量的一個或多個變量,用x表示。因變量與自變量之間的關系(guānxì)用一條線性方程來表示;精品資料實例(shílì):氣溫是否會顯著影響地溫;降雨量是否會影響到糧食產量;航班(hánɡbān)正點率是否對顧客投訴次數有顯著影響;廣告費用支出是否對銷售額有顯著影響;北極熊數量是否會影響企鵝的出生率(不會,反例);植物生長是否受土壤、降水、陽光等因素影響。精品資料描述因變量y如何依賴于自變量x和誤差項的方程稱為回歸模型一元線性回歸模型:y=b0+b1x+ey是x的線性函數(部分)加上誤差項線性部分反映了由于x的變化引起(yǐnqǐ)的y的變化誤差項是隨機變量反映了除x和y之間線性關系之外的隨機因素對y的影響是不能由x和y之間的線性關系所解釋的變異性0和1稱為模型的參數一元(yīyuán)線性回歸精品資料描述因變量y如何依賴于自變量x和誤差項的方程稱為回歸模型一元線性回歸模型:y=b0+b1x+ey是x的線性函數(部分)加上誤差項線性部分反映了由于x的變化引起的y的變化誤差項是隨機變量反映了除x和y之間線性關系之外的隨機因素對y的影響(yǐngxiǎng)是不能由x和y之間的線性關系所解釋的變異性0和1稱為模型的參數精品資料描述y的平均值或期望值如何依賴于x的方程稱為回歸方程;一元線性回歸方程的形式如下:E(y)=0+1x方程表示一條直線,也稱為直線回歸方程;0是回歸直線在y軸上的截距,是當x=0時y的期望值;1是直線的斜率,稱為回歸系數,表示當x每變動(biàndòng)一個單位時,y的平均變動(biàndòng)值精品資料估計(gūjì)的回歸方程總體回歸參數和是未知的,必須利用樣本數據去估計;用樣本統計量和代替回歸方程中的未知參數和,就得到了估計的回歸方程;一元線性回歸中估計的回歸方程為:其中:是估計的回歸直線在y軸上的截距,是直線的斜率(xiélǜ),它表示對于一個給定的x的值,是y的估計值,也表示x每變動一個單位時,y的平均變動值。精品資料最小二乘法(chéngfǎ)估計使因變量的觀察值與估計值之間的離差平方和達到最小來求得和的方法(fāngfǎ)。即
用最小二乘法擬合的直線來代表x與y之間的關系與實際數據的誤差比其他任何直線都小精品資料最小二乘估計(gūjì)(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^精品資料最小二乘法(chéngfǎ)根據最小二乘法的要求,可得求解和的公式(gōngshì)如下精品資料一元回歸方程統計(tǒngjì)檢驗的主要內容精品資料變差因變量y取值的波動稱為變差變差來源于兩個方面:由于自變量x的取值不同造成;除x以外的其他因素(如測量誤差等)的影響;對一個(yīɡè)具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示。精品資料變差的分解(fēnjiě)(圖示)xyy{}}精品資料離差平方和的分(三個平方和的意義(yìyì))總平方和(SST)用S表示反映因變量的n個觀察值與其均值的總離差;回歸平方和(SSR)用U表示反映自變量x的變化對因變量y取值變化的影響,是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的平方和;殘差平方和(SSE)用Q表示反映除x以外的其他(qítā)因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和;精品資料離差平方和的分解(fēnjiě)
(三個平方和的關系)SST=SSR+SSE或S=U+Q總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{精品資料判定(pàndìng)系數R2(coefficientofdetermination)回歸(huíguī)平方和占總離差平方和的比例反映回歸方程的擬合程度;取值范圍在[0,1]之間;
R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差;一元線性回歸中,判定系數等于y和x相關系數的平方,即R2=(r)2;精品資料線性關系的檢驗(jiǎnyàn)檢驗所有自變量與因變量之間的線性關系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以(jiāyǐ)比較,應用F檢驗來分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應的自由度(自變量的個數K);均方殘差:殘差平方和SSE除以相應的自由度(n-k-1)。精品資料線性關系的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)的步驟)提出假設H0:1=0所有回歸系數與零無顯著差異(chāyì),y與全體x的線性關系不顯著計算檢驗統計量F確定顯著性水平,并根據分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線性關系的檢驗(jiǎnyàn)(sig值檢驗(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設認為所有回歸系數與零存在顯著差異,被解釋變量y與解釋變量x的線性關系顯著,可以(kěyǐ)用線性模型描述它們之間的關系;Sig值大于顯著性水平a,不應拒絕零假設說明用線性模型描述x和y之間的關系是不恰當的。精品資料檢驗回歸方程中的每個解釋變量(biànliàng)x與被解釋變量(biànliàng)y之間是否存在顯著的線性關系;確定解釋變量(biànliàng)能否保留在線性回歸方程中。回歸系數的顯著性檢驗(jiǎnyàn)精品資料回歸系數的檢驗(jiǎnyàn)(樣本統計量的分布)是根據最小二乘法求出的樣本統計量,服從正態分布;的分布具有(jùyǒu)如下性質數學期望:標準差:由于未知,需用其估計量se來代替得到的估計標準差精品資料回歸系數的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)步驟)提出假設H0:b1=0(沒有線性關系)H1:b10(有線性關系)計算檢驗(jiǎnyàn)的統計量
確定顯著性水平,并進行決策t>t,拒絕H0;t<t,不能拒絕H0Sig值小于a,拒絕H0精品資料利用回歸方程進行(jìnxíng)估計和預測根據自變量x的取值估計或預測因變量y的取值估計或預測的類型點估計y的平均值的點估計y的個別(gèbié)值的點估計區間估計y的平均值的置信區間估計y的個別(gèbié)值的預測區間估計精品資料線性關系的檢驗(jiǎnyàn)檢驗(jiǎnyàn)所有自變量與因變量之間的線性關系是否顯著;將均方回歸(MSR)同均方殘差(MSE)加以比較,應用F檢驗(jiǎnyàn)來分析二者之間的差別是否顯著;均方回歸:回歸平方和SSR除以相應的自由度(自變量的個數K);均方殘差:殘差平方和SSE除以相應的自由度(n-k-1)。精品資料線性關系的檢驗(jiǎnyàn)(檢驗(jiǎnyàn)的步驟)提出假設H0:1=0所有(suǒyǒu)回歸系數與零無顯著差異,y與全體x的線性關系不顯著計算檢驗統計量F確定顯著性水平,并根據分子自由度1和分母自由度n-2找出臨界值F作出決策:若F>F,拒絕H0;若F<F,不能拒絕H0精品資料線性關系的檢驗(jiǎnyàn)(sig值檢驗(jiǎnyàn))Sig值小于顯著性水平a,拒絕零假設認為所有回歸系數與零存在顯著差異,被解釋變量y與解釋變量x的線性關系顯著,可以用線性模型描述(miáoshù)它們之間的關系;Sig值大于顯著性水平a,不應拒絕零假設說明用線性模型描述(miáoshù)x和y之間的關系是不恰當的。精品資料實例(shílì):精品資料精品資料(1)點擊(diǎnjī)statistics在回歸系數下拉框中估計,殘差下拉框中選中Durbin-Waston
(2)點擊(diǎnjī)在繪圖在左選框中選中DEPENDNT,標準化殘差圖選中正態概率圖
(3)點擊(diǎnjī)選項中默認設置精品資料殘差統計(tǒngjì)量方差分析模型(móxíng)匯總回歸分析圖精品資料在【模型匯總】中,主要顯示回歸模型中的相關系數、相關系數的平方、調整后的相關系數和估計(gūjì)的標準誤值在【方差分析】中主要顯示F檢驗值、顯著性檢驗P值、平方和、自由度在【殘差統計量】主要顯示預測值、殘差、標準預測值和標準殘差精品資料Multivariatelinearregression概念(gàiniàn):多元線性回歸分析也稱復線性回歸分析(multiplelinearregressionanalysis),它研究一組自變量如何直接影響(yǐngxiǎng)一個因變量。自變量(independentvariable)是指獨立自由變量的變量,用向量X表示;因變量(dependentvariable)是指非獨立的、受其它變量影響(yǐngxiǎng)的變量,用向量Y表示;由于模型僅涉及一個因變量,所以多元線性回歸分析也稱單變量線性回歸分析(univariatelinearregressionanalysis)精品資料多元回歸分析(fēnxī)數據格式精品資料多元線性回歸必須滿足的假定(jiǎdìng)條件因變量是服從正態分布的連續型隨機(suíjī)變量;k個自變量是固定變量,即非隨機(suíjī)或無度量誤差的變量;k個自變量間不存在多重共線性;k個自變量與殘差獨立;殘差是隨機(suíjī)變量,均值為零,方差為常數;各殘差間相互獨立;殘差服從正態分布。精品資料因變量是服從正態分布的連續型隨機(suíjī)變量;k個自變量是固定變量,即非隨機(suíjī)或無度量誤差的變量;k個自變量間不存在多重共線性;k個自變量與殘差獨立;殘差是隨機(suíjī)變量,均值為零,方差為常數;各殘差間相互獨立;殘差服從正態分布。統計檢驗(jiǎnyàn)結果偏倚結果失真結論的非唯一性模型中缺乏重要變量參數估計偏倚結果誤導精品資料假定因變量Y與自變量間存在如下關系:式中,是常數項,稱為偏回歸系數(partialregressioncoefficient)。的含義為在其它自變量保持不變的條件下,自變量改變一個單位時因變量Y的平均改變量。為隨機誤差,又稱殘差(residual),它表示的變化中不能由自變量解釋的部分。一、多元(duōyuán)線性回歸方程模型精品資料x1x2y精品資料應用(yìngyòng)條件:注意:雖然模型要求因變量是連續數值變量,但對自變量的類型不限。若自變量是分類變量,特別是無序分類變量,要轉化為亞變量才能分析。對于(duìyú)自變量是分類變量的情形,需要用廣義線性回歸模型分析。精品資料二、多元線性回歸分析(fēnxī)的步驟(一)估計各項參數,建立多元線性回歸方程模型(二)對整個模型進行假設檢驗,模型有意義的前提下,再分別(fēnbié)對各偏回歸系數進行假設檢驗。(三)計算相應指標,對模型的擬合效果進行評價。精品資料(一)模型(móxíng)的參數估計精品資料27名糖尿病患者的血清總膽固醇(x1)、甘油三酯(x2)、空腹(kōngfù)胰島素(x3)、糖化血紅蛋白(x4)、空腹(kōngfù)血糖(y)的測量值列于表中,試建立血糖與其它幾項指標關系的多元線性回歸方程。例精品資料各變量的離差矩陣精品資料線性回歸方程模型為:精品資料1、對模型的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)2、對偏回歸系數的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)和t檢驗(jiǎnyàn)3、標準偏化回歸系數(二)對模型及偏回歸系數的假設檢驗精品資料1、對模型的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料SS回歸=b1l1y+b2l2y
+b3l3y+b4l4y=0.1424×67.6962+0.3515×89.8025+0.2706×142.4347+0.6382×84.5570=133.7107;ν回歸=m=4各變量的離差矩陣精品資料SS總=lyy=222.5519;ν總=n-1=26SS剩余(shèngyú)=SS總-SS回歸=222.5519-133.7107=88.8412ν剩余(shèngyú)=n-m-1=22MS回歸=SS回歸/ν回歸;MS剩余(shèngyú)=SS剩余(shèngyú)/ν剩余(shèngyú);F=MS回歸/MS剩余(shèngyú)1、對模型的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料1、對模型的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)精品資料2、對偏回歸系數的假設檢驗(jiǎnyàn)—F檢驗(jiǎnyàn)和t檢驗(jiǎnyàn)回歸方程成立(chénglì)只能認為總的來說自變量與因變量間存在線性關系,但是否每一個自變量都與因變量間存在線性關系,須對其偏回歸系數進行假設檢驗。①方差分析法②t
檢驗法精品資料①偏回歸系數的假設檢驗--方差分析法精品資料①偏回歸系數的假設檢驗--方差分析法精品資料ParameterSta
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論