




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優質文檔-傾情為你奉上T<- read.table("G:/學習文件夾/R語言/R語言作業/5/住房狀況調查.csv",header=TRUE,sep=",")1、對變量計劃戶型制作一張頻數分布表,并繪制相應的圖形,寫出相應的結論(請寫出R代碼)table(T$計劃戶型)2、請對變量計劃面積選擇正確的圖形進行描述,寫出相應的結論(請寫出R代碼); hist(T$計劃面積, col = "lightgreen")3、對變量計劃面積,計算樣本數、平均值、中位數、修剪均值、樣本標準差、偏態系數、峰態系數、最大值、最小值、上下四分位
2、數,并對計劃面積的分布特征進行綜合分析(請寫出R代碼);t<-na.omit(T$計劃面積)summary(t)library("psych")describe(t)根據第二題的直方圖顯示,計劃面積的數據分布是非對稱分布,其中位數為100,平均數為101.6,上四分位數為80.0,下四分位數為120.0,分位數之差是40.04、請選用合適的圖形來展示變量計劃戶型和變量從業狀況之間的關系,并進行獨立性檢驗;(請寫出R代碼);t<- na.omit(T)b<-data.frame(t$從業狀況,t$計劃戶型)a<-table(b)barplot(a,ma
3、in="從業狀況與計劃戶型的關系",ylab="頻數",col=c(rainbow(6),beside=TRUE)summary(assocstats(a) H0:計劃戶型與從業狀況獨立,即兩個變量不關聯;H1:計劃戶型與從業狀況不獨立,即兩個變量關聯;Pearson卡方檢驗結果表明,n=719,X-squared = 129.270, df = 50, p-value = 6.0761e-09,小于0.05, 拒絕原假設,Cramers V = 0.19,有證據表明計劃戶型與從業狀況不獨立。5、請選用合適的圖形來展示變量戶口狀況和變量現住面積之間的關系
4、;如果想分析變量戶口狀況是否對變量現住面積產生顯著性影響,應該采取哪種統計分析方法?戶口狀況是否對變量現住面積產生顯著性影響?為什么?(請寫出R代碼)c<-data.frame(T$戶口狀況,T$現住面積)boxplot(T$現住面積T$戶口狀況,data=c,ylab="現住面積",xlab="戶口狀況",varwidth=TRUE,col="red2")如果想分析變量戶口狀況是否對變量現住面積產生顯著性影響:(1)首先,現住面積是大樣本數據,檢驗方差齊性時可以使用Levene檢驗,分析本市戶口人民的現住面積與外地戶口人民的現
5、住面積之間的總體方差是否有顯著性差異。根據R輸出結果, F = 5.4041, p-value =0.02016,p-value小于0.05,拒絕原假設;有證據表明本市戶口人民的現住面積與外地戶口人民的現住面積之間的總體方差存在顯著差異。leveneTest(T$現住面積T$戶口狀況,data=T)(2)本研究使用了獨立樣本t檢驗方法,分析本地戶口人民的現住面積和外地戶口人民的現住面積之間是否存在顯著差異。t.test(T$現住面積T$戶口狀況,data=T)cohensD(現住面積戶口狀況,data=T,method="unequal")由于t=3.3136,d=0.,d
6、f =182.43,p值=0.,p值小于0.05,所以拒絕原假設。有證據表明本地戶口人民的現住面積和外地戶口人民的現住面積之間存在顯著差異。但本案例的效應不大。6、如果想分析變量文化程度是否對變量家庭收入產生顯著性影響,應該采取哪種統計分析方法?文化程度是否對變量家庭收入產生顯著性影響?為什么?(請寫出R代碼)attach(T)shapiro.test(家庭收入文化程度="初中及以下")shapiro.test(家庭收入文化程度="大學(專、本科)")shapiro.test(家庭收入文化程度="高中(中專)")shapiro.tes
7、t(家庭收入文化程度="研究生及以上")原假設:文化程度為“初中及以下”時的家庭收入來自于正態總體;備擇假設:文化程度為“初中及以下”時的家庭收入不來自于正態總體。原假設:文化程度為“大學(專、本科)”時的家庭收入自于正態總體;備擇假設:文化程度為“大學(專、本科)”時的家庭收入不來自于正態總體。原假設:文化程度為“高中(中專)”時的家庭收入來自于正態總體;備擇假設:文化程度為“高中(中專)”時的家庭收入不來自于正態總體。原假設:文化程度為“研究生及以上”時的家庭收入來自于正態總體;備擇假設:文化程度為“研究生及以上”時的家庭收入不來自于正態總體。根據輸出結果,n1=805
8、,n2=896,n3=1258,n4=34, 各組的p值均小于0.05, 拒絕原假設,有證據表明各組數據不服從正態分布。describe.by(家庭收入,文化程度)對不同教育水平的家庭收入進行Shapiro-Wilk檢驗, 根據R輸出結果,所有的p-value都小于0.05,拒絕原假設,證據表明不同教育水平的家庭收入不服從正態分布。該樣本雖為大樣本,但為高度偏態分布(|sk|>0.5)。本案例不滿足單因素方差分析的正態性條件。leveneTest(家庭收入文化程度,data=T)總體方差齊性可以使用levene檢驗,根據levene檢驗,F值為22.908,p值為1.168e-14,拒絕
9、原假設,有證據證明不同教育水平的家庭收入的總體方差不相等。因此本案例不符合單因素方差分析的應用條件,故采用非參數中的Kruskal-Wallis檢驗。原假設:不同文化程度的人民其家庭收入的中位數相等;備擇假設:不同文化程度人民的家庭收入的中位數不全相等;檢驗統計量Chi-Square為452.43,p值非常小,小于0.05,拒絕原假設,有證據證明不同文化程度人民的家庭收入的中位數不全相等。7、請選用合適的圖形來展示變量家庭收入和變量計劃面積之間的關系,寫出相應的結論(請寫出R代碼);plot(T$家庭收入,T$計劃面積)8、 如果建立計劃面積關于家庭收入, 常住人口, 現住面積的多元線性回歸模
10、型。(請寫出R代碼)(1)寫出估計的多元線性回歸方程,并解釋回歸系數的實際意義; (2)計算判定系數,并解釋其意義;計算估計標準誤差,并解釋其意義。(3)對回歸模型進行整體檢驗(a=0.05)。(4)檢驗各回歸系數是否顯著(a=0.05)。(5)多元線性回歸分析的基本假定是什么?本案例是否滿足?。(6)根據你的判斷,模型中是否存在多重共線性?d<-lm(計劃面積家庭收入+常住人口+現住面積,data=T)summary(d)(1)根據輸出結果:回歸方程為y=84.+0.x1 -4.x2+0.x3x1的回歸系數為0.,其含義是:當x2、x3 保持不變時,x1(家庭收入)每增加1元,因變量y
11、(計劃面積)平均增加0.平米。x2的回歸系數為-4.,其含義是:當x1、x3 保持不變時,x2(常住人口)每增加1人,因變量y(計劃面積)平均減少4.平米。x3的回歸系數為0.,其含義是:當x1、x2 保持不變時,x3(現住面積)每增加1平米,因變量y(計劃面積)平均增加0.平米。(2)根據輸出結果:修正的判定系數為0.2289。修正的R2值=22.89%,說明模型與數據擬合的不夠好,在計劃面積的變動中,有22.89%是由家庭收入、常住人口和現住面積的多元線性回歸方程所解釋的。本回歸方程擬合的不好,需要增加自變量。標準回歸誤差是25.95,表示用估計的回歸方程預測y時,預測誤差的相對大小為25
12、.95。(3)整體性檢驗:H0:1=2=3=0;H0:1、2、3至少有一個不等于0。根據輸出結果,通過F檢驗得出F值為83.21,P值非常小,拒絕原假設。(4)顯著性檢驗:使用t檢驗的方法,H0:i = 0;H1:i 0。對于自變量x1(家庭收入):t值為6.663,P值小于0.05,拒絕原假設。1顯著。對于自變量x2(常住人口):t值為-5.435,P值小于0.05,拒絕原假設。2顯著。對于自變量x3(現住面積):t值為11.116,P值小于0.05,拒絕原假設。3顯著。 (5) 基本假定:1、 誤差項是一個服從正態分布的隨機變量,且相互獨立,即2、 獨立性3、 線性4、 同方差性g<-lm(計劃面積家庭收入+常住人口+現住面積,data=T)par(mfrow=c(2,2)plot(g)h<- residuals(g)shapiro.test(h)qqPlot(g)正態性檢驗:p<0.01,能拒絕原假設,有證據表明殘差不服從正態分布。durbinWatsonTest(g)獨立性檢驗:P值不顯著(p=0.334)說明無自相關性,誤差項之間獨立。線性檢驗:在“殘差與擬合圖”(residuals vs fitted)中可以看到殘差與預測值似乎有某
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業園區規劃與產業升級策略
- 工業排污控制與治理
- 工業旅游景區規劃與環境設計研究
- 工業機器人設計與維護指南
- 工業廢水處理工程驗收案例分享
- 工業機器人技術及其產業發展
- 工業機器人故障診斷與預防技術
- 工業設備故障排查與預防措施
- 工業涂裝生產線的發展趨勢與挑戰
- 工業設計在智能制造中的作用
- 2025年江蘇鹽城燕舞集團有限公司招聘筆試參考題庫含答案解析
- 手持砂輪機培訓課件
- 輻射防護復習題及答案
- 2024年上海市中考英語試題和答案
- 安全管理紅線
- 隔爆設施安撤安全操作規程模版(2篇)
- 2025屆高考語文一輪復習:小說閱讀測試卷一(含解析)
- 急性肺栓塞急救與護理
- 妊娠合并乙肝的護理查房
- 吹氣球治療肺部疾病
- DB51-T 2975-2022 氣凝膠復合保溫隔熱材料及系統通.用技術條件
評論
0/150
提交評論