R語言線性回歸分析案例報告 附代碼數據_第1頁
R語言線性回歸分析案例報告 附代碼數據_第2頁
R語言線性回歸分析案例報告 附代碼數據_第3頁
R語言線性回歸分析案例報告 附代碼數據_第4頁
R語言線性回歸分析案例報告 附代碼數據_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

R語言線性回歸案例報告

R初始指令

安裝“汽車”包:install.packages(“汽車”)加載庫汽車library("car")加載汽車中的數據:數據(Salaries,package=“car”)查看您的辦公桌上的數據(屏幕):它所表示的薪水視圖(幫助)和數據描述:help(薪水)

變量的確切名稱:名稱(薪金)datos<-Salariesnames(datos)##[1]"rank""discipline""yrs.since.phd""yrs.service"##[5]"sex""salary"考慮誰是定量和定性的變量head(datos)##rankdisciplineyrs.since.phdyrs.servicesexsalary##1ProfB1918Male139750##2ProfB2016Male173200##3AsstProfB43Male79750##4ProfB4539Male115000##5ProfB4041Male141500##6AssocProfB66Male97000分散圖

雖然有些變量不是量化的,但相反,它們是絕對的,例如秩序是有序的,我們將要制作離散圖pairs(datos,col="blue")考慮到圖表,我們將運行變量之間的簡單回歸模型:“yrs.since.phd”“yrs.service”,但首先讓我們來回顧一下變量之間的相關性。

因此,我們要確定假設正態性的相關系數cor(datos$yrs.since.phd,datos$yrs.service)##[1]0.9096491考慮到這兩個變量之間的相關性高,解釋結果regresion<-lm(yrs.since.phd~yrs.service,data=datos)regresion####Call:##lm(formula=yrs.since.phd~yrs.service,data=datos)####Coefficients:##(Intercept)yrs.service##6.43840.9013結果

因變量yrs.since.phd的選擇是正確的,請解釋為什么編寫表單的模型:y=intercept+oendiente*x

解釋截距和斜率summary(regresion)####Call:##lm(formula=yrs.since.phd~yrs.service,data=datos)####Residuals:##Min1QMedian3QMax##-11.518-3.748-1.5502.52224.450####Coefficients:##EstimateStd.ErrortvaluePr(>|t|)##(Intercept)6.438380.4532314.21<2e-16***##yrs.service0.901320.0207143.52<2e-16***##---##Signif.codes:0'***'0.001'**'0.01'*'0.05'.'0.1''1####Residualstandarderror:5.36on395degreesoffreedom##MultipleR-squared:0.8275,AdjustedR-squared:0.827##F-statistic:1894on1and395DF,p-value:<2.2e-16假設檢驗

根據測試結果,考慮到p值=2e-16,是否拒絕了5%的顯著性值的假設?

斜率為零根據測試結果,考慮到p值=2e-16,關于斜率的假設是否被拒絕了5%的顯著性值?

考慮到變量yrs.service在模型中是重要的

模型和測試調整

考慮到R的平方值為0.827,你認為該模型具有良好的線性擬合?

解釋調整的R平方值考慮到驗證數據與模型擬合的測試由F統計得到:1894在1和395DF,p值:<2.2e-16認為模型符合調整?

##使用模型進行估計為變量x的以下值查找yrs.since.phd的估計值:x<-c(12,11,35)x##[1]121135Graficasdelmodeloplot(datos$yrs.service,datos$yrs.since.phd,xlab="a?osdeserivio",ylab="a?osdePhD",col="red")abline(regresion)ValidacióndelmodeloEnestecasosedeseadeterminarlosresiduos(error)entreelmodeloyloobservadoyversilosresiduoscumplencon:1.Tenermedia=02.Varianza=constante3.Sedistribuyennormal(0,constante)Losresiduossegeneranacontinuación(porfacilidadsologeneramoslosprimeros20[1:20])residuos<-rstandard(regresion)residuos[1:20]##123456##-0.68414645-0.16058147-0.962189840.63921055-0.63640410-1.09326547##789101112##0.52900688-0.37536060-0.64730590-0.87095822-0.30826102-0.23226232##131415161718##-1.18678371-0.83107204-0.497334670.53469705-1.020944940.17157280##1920##1.836971730.02133757Valoresajustados,esdecirelvalordelavariableydad0porelmodelo(porfacilidadsologeneramoslosprimeros20[1:20])valores.ajustados<-fitted(regresion)valores.ajustados[1:20]##1234567##22.66222320.8595749.14235241.59004443.39269311.84632627.168847##891011121314##46.99799324.46487322.66222313.6489768.2410277.3397026.438377##151617181920##22.6622239.14235224.46487337.08342027.16884738.886070Pruebadenormalidad,utilizamoslapruebaQQquepermitededucirsilosdatosseajustanalanormal(silosdatosestancercadelalínea)qqnorm(residuos,col="blue")qqline(residuos,col="red")ValidacióndelmodeloEnestecasosedeseadeterminarlosresiduos(error)entreelmodeloyloobservadoyversilosresiduoscumplencon:1.Tenermedia=02.Varianza=constante3.Sedistribuyennormal(0,constante)Losresiduossegeneranacontinuación(porfacilidadsologeneramoslosprimeros20[1:20])residuos<-rstandard(regresion)residuos[1:20]##123456##-0.68414645-0.16058147-0.962189840.63921055-0.63640410-1.09326547##789101112##0.52900688-0.37536060-0.64730590-0.87095822-0.30826102-0.23226232##131415161718##-1.18678371-0.83107204-0.497334670.53469705-1.020944940.17157280##1920##1.836971730.02133757Valoresajustados,esdecirelvalordelavariableydad0porelmodelo(porfacilidadsologeneramoslosprimeros20[1:20])valores.ajustados<-fitted(regresion)valores.ajustados[1:20]##1234567##22.66222320.8595749.14235241.59004443.39269311.84632627.168847##891011121314##46.99799324.46487322.66222313.6489768.2410277.3397026.438377##151617181920##22.6622239.14235224.46487337.08342027.1688473

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論