簡單線性回歸分析2_第1頁
簡單線性回歸分析2_第2頁
簡單線性回歸分析2_第3頁
簡單線性回歸分析2_第4頁
簡單線性回歸分析2_第5頁
已閱讀5頁,還剩59頁未讀 繼續免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

例10-1為研究大氣污染物一氧化氮(NO)的濃度是否受到汽車流量的影響,選擇24個工業水平相近城市的一個交通點,統計單位時間過往的汽車數(千輛),同時在低空相同高度測定了該時間段空氣中一氧化氮(NO)的濃度(×10-6),數據如表10-1所示。2025/6/2312025/6/2322025/6/233解析:目的:在于通過探討車流量與NO濃度的關系,為控制空氣污染提供依據。一個變量的變化(如空氣中NO濃度)如何受到另外一個變量(如車流量)變化的制約。這些問題在統計學中采用回歸模型(regressionmodel)來進行分析。2025/6/234簡單線性回歸分析2025/6/235目的要求掌握線性回歸的根本概念、回歸系數的含義及假設檢驗;熟悉回歸方程的最小二乘原那么;熟悉回歸系數的計算方法和回歸模型的前提假設;熟悉總體回歸線的95%置信帶與個體預測值Y的區間估計;了解應用線性回歸分析進行統計控制;了解統計內容的報告與中英文表達。2025/6/236簡單線性回歸分析根本概念簡單線性回歸模型結果報告案例辨析常見疑問與小結2025/6/237回歸分析與簡單線性回歸解釋變量與反響變量一、根本概念2025/6/238回歸分析(regressionanalysis):研究一個變量與另一個或一組變量之間依存性或依存關系的一種統計分析方法。回歸模型(regressionmodel):描述變量之間的依存關系的函數。簡單線性回歸(simplelinearregression):模型中只包含兩個有“依存關系〞的變量,一個變量隨另外一個變量的變化而變化,且呈直線變化趨勢,稱之為簡單線性回歸。2025/6/239例如,舒張壓和血清膽固醇的依存性編號舒張壓膽固醇

(id)(y)(x)180307275259390341470237575254610541677026788532098837410783162025/6/2310解釋變量與反響變量解釋變量(explanatoryvariable):又稱自變量〔independentvariable):能獨立自由變化的變量,可以是隨機變量,也可以是人為控制或選擇的變量;一般用X表示反響變量(responsevariable):又稱為因變量〔dependentvariable):非獨立的、受其他變量影響的變量,一般用Y表示。2025/6/2311二、簡單線性回歸模型2025/6/2312例10-1中,假設只考慮NO濃度與車流量的關系,以NO濃度為因變量,車流量為自變量,采用回歸分析通常要到達以下三個目的:統計描述應用回歸方程定量描述兩個變量間的關系;統計推斷通過假設檢驗推斷NO平均濃度是否隨著車流量變化而變化;統計應用利用模型進行統計預測或控制。2025/6/2313兩變量關系的定量描述散點圖簡單線性回歸方程回歸系數的計算——回歸系數的最小二乘估計線性回歸分析的前提條件2025/6/23141.散點圖主要考察三點:是否有線性趨勢是否存在異常點。是否需要分層分析2025/6/23152.簡單線性回歸方程2025/6/2316截距(intercept,constant)X=0時,Y的平均值α的單位與Y的相同當X可能取0時,α才有實際意義。α的意義2025/6/2317總體回歸系數(regressioncoefficient),直線的斜率〔Slope〕X每增加(或減少)一個單位,Y平均改變β個單位。β>0,Y與X呈同向線性變化趨勢;β<0,Y與X呈反向線性變化趨勢;β=0,Y與X無線性回歸關系,但不說明沒有其他關系。β的單位為(Y的單位/X的單位)β的意義2025/6/2318為估計值稱為殘差2025/6/2319

的意義:點到直線的縱向距離。1112131415165.05.56.06.52025/6/2320殘差平方和(residualsumofsquares).綜合表示點距直線的距離。

的意義2025/6/23212025/6/2322最小二乘原那么:殘差平方和最小。2025/6/23233.回歸系數的最小二乘估計求出回歸系數α和β的估計值,使得殘差平方和到達最小。即,使得到達最小,應用微積分求極值的方法可得2025/6/2324b=0.1584,a=-0.13532025/6/2325回歸直線的有關性質(1)

直線通過均點(2)各點到該回歸線縱向距離平方和較到其它任何直線小。

2025/6/23264.線性回歸分析的前提條件(LINE)線性〔linear)獨立〔independent)正態(normal)等方差〔equalvariance)2025/6/2327

線性〔linear)指反響變量Y的總體平均值與自變量X呈線性關系。獨立〔independent)指任意兩個觀察值互相獨立。正態(normal)假定是指線性模型的誤差項服從正態分布。等方差〔equalvariance)是指在自變量X取值范圍內,不管X取什么值,Y都具有相同的方差。2025/6/2328圖10-2回歸模型前提假設立體示意圖2025/6/2329二、簡單線性回歸模型兩變量關系的定量描述統計推斷回歸模型的假設檢驗(modeltest)回歸系數的假設檢驗(parametertest)總體回歸系數的區間估計回歸效果的評價指標——決定系數2025/6/23301.檢驗回歸模型是否成立(modeltest)——方差分析2025/6/2331圖10-3Y的總變異分解示意圖總變異的分解2025/6/23322025/6/23332025/6/2334Y的離均差平方和,表示因變量Y的總變異回歸平方和,表示當自變量X引入模型后所引起的變化,反映了在Y的總變異中可以用Y與X的線性關系解釋的那局部變異。2025/6/2335殘差平方和,反映自變量X以外因素對Y的變異的影響,也就是在Y的總變異中無法用Y與X的回歸關系解釋的那局部變異。2025/6/23362025/6/2337回歸模型的假設檢驗H0:總體回歸方程不成立或總體中自變量X對因變量Y沒有奉獻;H1:總體回歸方程成立或總體中自變量X對因變量Y有奉獻;α=0.052025/6/2338在H0成立時,2025/6/23392.檢驗總體回歸系數是否為零(parametertest)——t檢驗2025/6/2340總體回歸系數β的假設檢驗

H0:β=0,H1:β≠0α=0.052025/6/2341H0成立時,該統計量應服從v=n-2的t分布

,其中Sb為b的標準誤2025/6/23422025/6/2343對于簡單線性回歸分析對回歸方程的假設檢驗的方差分析與對回歸系數假設檢驗的t檢驗是等價的。相關系數的假設檢驗與回歸系數的假設檢驗是等價的。2025/6/23443.總體回歸系數β的區間估計2025/6/2345

b越大,X對Y的影響就越大?回歸系數越大只能說明Y隨X的變化越快,并不能說明X對Y的影響的大小。2025/6/23464.回歸效果的評價指標——決定系數定義為回歸平方和與總平方和之比,記為R2,無量綱,取值在0到1之間;Y的總變異中回歸關系所能解釋的百分比;擬合優度指標;當兩變量都為隨機變量時,決定系數等于相關系數的平方。2025/6/2347R2=SS回歸/SS總=0.0530/0.0812=0.6527說明在空氣中NO濃度總變異的65.27%與車流量有關。2025/6/2348二、簡單線性回歸模型兩變量關系的定量描述統計推斷統計應用統計預測Y的均值的區間估計:總體回歸線的95%置信帶〔相應X取值水平下,〕;個體Y預測值的區間估計。統計控制2025/6/2349

樣本總體Y的平均給定X時Y的平均

(Y的條件均數)2025/6/2350剩余標準差、條件標準誤、條件標準差抽樣誤差個體變異2025/6/2351

1.的可信區間估計

2025/6/2352當車流量為1300輛時,空氣中一氧化氮95%置信區間為:2025/6/23532.個體的容許區間:總體中X為某定值Xi時,個體Y值的變動范圍。其1-α置信區間為:2025/6/2354當車流量為1300輛時,空氣中一氧化氮95%容許區間為:2025/6/23552025/6/23563.統計控制:根據空氣污染指數分級,當空氣質量狀況不超過Ⅱ級時,要求空氣中氮氧化物含量不超過0.100-0.150×10-6。該城市為降低控制NO的含量,擬對車流量作適當控制。依據估計的回歸方程和以上標準,分別計算得:Y1=0.100×10-6時,X1=(Y1-a)/b=(0.100+0.1353)/0.1584=1.485(千輛)Y2=0.150×10-6時,X2=(Y2-a)/b=(0.150+0.1353)/0.1584=1.801(千輛)2025/6/2357直線回歸與直線相關的區別與聯系區別r沒有單位,b有單位;所以,相關系數與單位無關,回歸系數與單位有關;相關表示相互關系;回歸表示依存關系;對資料的要求不同:當X和Y都是隨機的,可以進行相關和回歸分析;當Y是隨機的(X是控制的),理論上只能作回歸而不能作相關分析;2025/6/2358直線回歸與直線相關的區別與聯系聯系假設檢驗等價:tb=trr,b同正同負,且r=0,那么b=0。2025/6/2359三、結果報告簡單線性回歸分析通常需要報告以下內容:分析目的;擬合簡單線性回歸方程的估計方法;是否符合前提條件;參數估計結果;模型的擬合優度及其假設檢驗;對結果的專業解釋。2025/6/2360四、案例辨析〔略〕2025/6/2361小結簡單線性回歸分析的根本步驟:繪制散點圖,考察兩變量是否有線性趨勢、可疑的異常點及是否需要分層處理;估計回歸系數與截距;對總體回歸系數或回歸方程進行假設檢驗;列出回歸方程,繪制回歸直線;統計應用。2025/6/2362簡單線性回歸是指只包含一個自變量,且呈線性變化趨勢的線性回歸模型,用于描述因變量的總體均數與自變量之間的線性關系,亦稱兩變量間的依存變化關系。在實際應用中,兩變量間的關系應有實際意義,不要把毫無關聯的兩種現象作回歸分析。簡單線性回歸包括截距與回歸系數兩個參數,通常采用最小二乘估計。通過對Y的總變異分解有助于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論