




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文題目 全國近20年來人口增長原因分析數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文摘 要的增長產生顯著影響。R軟件是一種開源的免費數據分析軟件,功能強大,是數據分析工作者的首選軟件之一。關鍵詞:R語言;多元線性回歸分析;方差分析。目 錄引言 1選題的背景和意義 1研究方法與思路 1正文 2前言 2數據分析 2數據預處理 2回歸分析 4方差分析 8結論 13參考文獻 13數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文II引言選題的背景和意義二孩政策,是中國實行的一種計劃生育政策,規定符合條件的夫婦允許生育“二胎”。因為是二孩政策,故第一胎為多孩時,不可生第二胎。201111;20131210在經歷了迅速從高生育率到低生育率的轉變之后,我國人口的主要矛盾已經不再是增長過快,而是人口紅利消失、臨近超低生育率水平、人口老齡化、出生性別比失調等問題。國內20多位頂尖人口學者歷經兩年的研究指出,我國的人口政策亟待轉向,尤其是生育政策應該調整。研究方法與思路人數和醫療發展程度有關。方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量。所以可以采用方差分析,得到所有因素中影響程度最大的那一個。正文前言2015-2014(萬人(萬對(萬元(萬人醫院數(個)R數據處理年份人口總數 年份人口總數 婚姻登記居民消費水平參加生育保險醫院數(個)(萬人)(萬對)(元)人數(萬人)1995年121121934.123301500.2156631996年122389938.727652015.6158331997年123626914.129782485.9159441998年124761891.731262776.7160011999年125786885.333462929.8166782000年126743848.537213001.6163182001年12762780539873455.1161972002年12845378643013488.2178442003年129227811.446063655.4177642004年129988867.251384383.8183932005年130756823.157715408.5187032006年13144894564166458.9192462007年132129991.475727775.3198522008年1328021098.387079254.1197122009年1334501212.4951410875.7202912010年13409112411091912335.9209182011年1347351302.361313413892219792012年1354041323.591469915428.7231702013年1360721346.931619016392247092014年1367821306.741777817038.725860txtR(萬對居民消費水平(萬元),參加生育保險人數(萬人),醫院數(個)”依次命名為X1、X2、X3、X4,把“人口總數(萬人)”,Y。在R軟件內打開txt:人口增長<-read.table(file="人口增長.txt",header=T,sep="")人口增長年份 Y X1 X2 X3 X41 1995年121121 934.10 2330 1500.22 1996年122389 938.70 2765 2015.6158333 1997年123626 914.10 2978 2485.9159444 1998年124761 891.70 3126 2776.7160015 1999年125786 885.30 3346 2929.8166786 2000年126743 848.50 3721 3001.6163187 2001年127627 805.00 3987 3455.1161978 2002年128453 786.00 4301 3488.2178449 2003年129227 811.40 4606 3655.417764102004年129988 867.20 5138 4383.818393112005年130756 823.10 5771 5408.518703122006年131448 945.00 6416 6458.919246數據挖掘技術與實驗課程論文132007年132129 991.40 7572 7775.319852142008年1328021098.30 8707 9254.119712152009年1334501212.40 951410875.720291162010年1340911241.001091912335.920918172011年1347351302.361313413892.021979182012年1354041323.591469915428.723170192013年1360721346.931619016392.024709202014年1367821306.741777817038.725860回歸分析繪制散點圖先利用pairs函數,繪制如圖1-1所示的矩陣散點圖。pairs(~Y+X1+X2+X3+X4,data=人口增長,main="人口增長相關矩陣散點圖")IV數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文PAGE\*ROMANPAGE\*ROMANV(萬人歸模型進行回歸。建立回歸模型建立回歸模型為Y0
X11
X2
X33
X。4 4。Rlm語句:Fit<-lm(Y~X1+X2+X3+X4,data=人口增長)coefficients(Fit)(Intercept)X1X2X3X4130652.757898-24.032044-2.2838413.2472610.886581說明建立的線性回歸方程為:Y130652.75824.032X2.284X3.247X0.887X1 2 3 4參數檢驗查看人流量Y線性回歸方程的參數檢驗結果:Call:lm(formula=Y~X1+X2+X3+X4,data=人口增長)Residuals:Median3QMax-201.8Median3QMax-201.8458.61368.0-1080.5 -477.6Coefficients:EstimateStd.ErrortvaluePr(>|t|)數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文I(Intercept)1.307e+057.716e+0316.9333.47e-11***X1-2.403e+013.216e+00-7.4721.97e-06***X2-2.284e+004.293e-01-5.3198.58e-05***X33.247e+003.435e-019.4541.04e-07***X48.866e-014.180e-012.1210.051.Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’Residualstandarderror:731.9on15degreesoffreedomMultipleR-squared: 0.9809, AdjustedR-squared: 0.9757F-statistic:192.1on4and15DF,p-value:1.09e-12192.1,概率p1.09e-12水平α0.05,pα,拒絕原假設,選擇線性模型合理。X4t0.051,t統計量的標準誤(分母)為2.121X4后重新建模。Fit<-lm(Y~X1+X2+X3,data=人口增長)Call:lm(formula=Y~X1+X2+X3,data=人口增長)Residuals:Min 1Q Median 3Q Max-1135.05 -490.66 -80.94 465.84 1797.51Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)1.464e+052.365e+0361.902<2e-16***X1-2.786e+012.937e+00-9.4865.70e-08***X2-1.678e+003.539e-01-4.7420.000221***X33.330e+003.767e-018.8401.48e-07***Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’Residualstandarderror:807.9on16degreesoffreedomMultipleR-squared: 0.9751, AdjustedR-squared: 0.9704F-statistic: 209on3and16DF, p-value:4.859e-13coefficients(Fit)(Intercept)X1X2X3146375.839081-27.863955-1.6779833.330386現在回歸方程的顯著性檢驗和回歸系數的顯著性檢驗均通過,所以該模型可用。這是個三元線性回歸方程,方程表達式為:Y146375.83927.864X1.678X3.330X1 2 3小結(萬個(萬對(萬元),參加生育保險人數(萬人),醫院數(個)”有一定關系。方差分析X1Yaov(Y~X1,dataCall:aov(formula=Y~X1,data=人口增長)Terms:X1ResidualsSumofSquares 232695651186969574Deg.ofFreedom 1 18Residualstandarderror:3222.918Estimatedeffectsmaybeunbalanced1<-aov(Y~X1,data=人口增長)anova1)AnalysisofVarianceTableResponse:YDfSumSqMeanSqFvaluePr(>F)X11232695651232695651 22.4020.000166***Residuals1818696957410387199Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文PAGE\*ROMANPAGE\*ROMANXX1232695651,186969574,11910387199。F22.402,p0.000166α0.05,則因概率p小于α,拒絕原假設,即認為不同年份的婚姻登記(萬對)口總數具有影響。X2Yaov(Y~X2,dataCall:aov(formula=Y~X2,data=人口增長)Terms:X2ResidualsSumofSquares 340784192 Deg.ofFreedom 1 18Residualstandarderror:2093.389Estimatedeffectsmaybeunbalanced2<-aov(Y~X2,data=人口增長)anova2)AnalysisofVarianceTableResponse:YDf SumSq MeanSqFvalue Pr(>F)X2 1340784192340784192 77.7645.96e-08***Residuals18 78881033 4382280Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1X2340784192,78881033,1184382280。F77.764,p5.96e-08α為0.05,則因概率p小于α,拒絕原假設,即認為不同年份的居民消費水平(萬元)對人口總數具有影響。X3Yaov(Y~X3,dataCall:aov(formula=Y~X3,data=人口增長)Terms:X3ResidualsSumofSquares 349641867 Deg.ofFreedom 1 18Residualstandarderror:1972.356Estimatedeffectsmaybeunbalanced3<-aov(Y~X3,data=人口增長)數據挖掘技術與實驗課程論文數據挖掘技術與實驗課程論文Ianova3)AnalysisofVarianceTableResponse:YDfSumSqMeanSqFvalue Pr(>F)X31349641867349641867 89.8782.017e-08***Residuals18700233583890187Signif.codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1X3349641867,70023358,1183890187。F89.878,p2.017e-08。若顯著性水平αp(人)對人口總數具有影響。X4Yaov(Y~X4,dataCall:aov(formula=Y~X4,data=人口增長)Terms:X4ResidualsSumofSqu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農業種植新品種研發合作合同書
- 農業服務行業資源共享合同
- 餐廳室內外裝飾工程監理與施工合同
- 2025年初升高暑期數學講義專題02 因式分解分層訓練(含答案)
- 2025年注冊環保工程師環境監測沖刺試卷(含操作步驟)押題實戰精講
- 生物●廣東卷丨2024年廣東省普通高中學業水平選擇性考試生物試卷及答案
- 考研復習-風景園林基礎考研試題帶答案詳解(培優a卷)
- 2025-2026年高校教師資格證之《高等教育法規》通關題庫附參考答案詳解(培優)
- 2025年黑龍江省五常市輔警招聘考試試題題庫及答案詳解一套
- 2025年Z世代消費趨勢下新消費品牌市場潛力研究報告
- 電廠班組安全教育課件
- PDCA降低護士針刺傷發生率
- 陪玩內部管理制度
- 直播話術完整版范本
- NB-T 11076-2023 高壓交流故障電流限制器通用技術規范
- 勞務派遣應急預案(純方案)
- 政府專職消防員(文職雇員)應聘登記表
- 創業公司預算表格式
- 口腔助理醫師考試大綱
- DLT-969-2023年變電站運行導則
- 大學語文-陜西師范大學中國大學mooc課后章節答案期末考試題庫2023年
評論
0/150
提交評論