




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、R語(yǔ)言實(shí)驗(yàn)指導(dǎo)書(shū)(二)2016年10月27日實(shí)驗(yàn)三創(chuàng)建與使用R語(yǔ)言數(shù)據(jù)集實(shí)驗(yàn)?zāi)康茫? . 了解R語(yǔ)言中得數(shù)據(jù)結(jié)構(gòu)。2 .熟練掌握她們得創(chuàng)建方法,與函數(shù)中一些參數(shù)得使用。3 .對(duì)創(chuàng)建得數(shù)據(jù)結(jié)構(gòu)進(jìn)行,排序、查找、刪除等簡(jiǎn)單得操作。實(shí)驗(yàn)內(nèi)容:1 .向量得創(chuàng)建及因子得創(chuàng)建與查瞧有一份來(lái)自澳大利亞所有州與行政區(qū)得 20個(gè)稅務(wù)會(huì)計(jì)師得信息樣本1 以及她們各自所在地得州名。州名為:tas, sa, qld, nsw, nsw, nt, wa, wa, qld, vic, nsw, vic, qld, qld, sa, tas, sa, nt, wa, vic。1)將這些州名以字符串得形式保存在 state當(dāng)
2、中。2)創(chuàng)建一個(gè)為這個(gè)向量創(chuàng)建一個(gè)因子 statef 。3)使用levels函數(shù)查瞧因子得水平。2 .矩陣與數(shù)組。1. 創(chuàng)建一個(gè)4*5得數(shù)組如圖,創(chuàng)建一個(gè)索引矩陣如圖,用這個(gè)索引矩陣訪問(wèn)數(shù)組,觀察結(jié)果。3 .將之前得state ,數(shù)組,矩陣合在一起創(chuàng)建一個(gè)長(zhǎng)度為3得列表。4 .創(chuàng)建一個(gè)數(shù)據(jù)框如圖。mpg cyl disp hp dratMazda RX4Mazda RX4 WagDatsun 710Hornet 4 Drive21.06 160.0 110 3.9021,06160.01103.9022.8410S.0933.8521.46258.01103,085 .將這個(gè)數(shù)據(jù)框按照mpg列
3、進(jìn)行排序。6 .訪問(wèn)數(shù)據(jù)框中drat列值為3、90得數(shù)據(jù) 實(shí)驗(yàn)要求要求學(xué)生熟練掌握向量、矩陣、數(shù)據(jù)框、列表、因子得創(chuàng)建與使用實(shí)驗(yàn)四 數(shù)據(jù)得導(dǎo)入導(dǎo)由實(shí)驗(yàn)?zāi)康? .熟練掌握從一些包中讀取數(shù)據(jù)2 .熟練掌握csv文件得導(dǎo)入。3 .創(chuàng)建一個(gè)數(shù)據(jù)框,并導(dǎo)出為csv格式 實(shí)驗(yàn)內(nèi)容1.2.創(chuàng)建一個(gè)csv文件(內(nèi)容自定),并用readtable函數(shù)導(dǎo)入該文件。查瞧R語(yǔ)言自帶得數(shù)據(jù)集airquality (紐約1973年5-9月每日空氣質(zhì)3.4.5.6.量)。歹!J出 airquality 查瞧 airquality 查瞧 airquality得前十列,并將這前十列保存到air中。 中列得對(duì)象類型。數(shù)據(jù)集中各成
4、分得名稱將air這個(gè)數(shù)據(jù)框?qū)С鰹閏sv格式文件(write 、table (x, file"",sep="", row、names =TRUE, col、names =TRUE, quote =TRUE)實(shí)驗(yàn)要求 要求學(xué)生掌握從包中讀取數(shù)據(jù),導(dǎo)入csv文件得數(shù)據(jù),并學(xué)會(huì)將文件導(dǎo)出實(shí)驗(yàn)五R語(yǔ)言數(shù)據(jù)得清洗實(shí)驗(yàn)?zāi)康? .查瞧數(shù)據(jù)集得缺失值,并學(xué)會(huì)對(duì)缺失值進(jìn)行處理。2 .對(duì)異常變量重新賦值。3 .將某一列得字符型轉(zhuǎn)化為日期型。4 .利用subset()獲取子集。實(shí)驗(yàn)內(nèi)容1 .有一個(gè)數(shù)據(jù)框代碼如下,使用summary函數(shù)查瞧,那一列含有缺失值,有 幾個(gè)。并查瞧wi
5、nd列得最大值。Ozone <- c(41,36, 12, 18, NA, 28)Solar、R <- c(190, 118, 149, 313, NA, NA)wind <- c(7 、4, 8、0, 12、6, 11、5, 14、3, 14、9)Temp <- c(67, 82, 74, 62, 86, 66)date <- c(”1997/05/01",”1997/05/02",”1997/05/03",”1997/05/04”,“1997/05/05",”1997/05/06”)air <- data 、fra
6、me(date,Ozone,Solar 、R,wind,Temp, stringsAsFac tors = FALSE)2 .使用class()函數(shù)查瞧date函數(shù)得類型,并將其轉(zhuǎn)化為data型,格式為 月/日/3 . 使用subset()根據(jù)Tem矽!J獲取air中Temp大于60小于70得數(shù)據(jù)。4 .將air中含有缺失值得列去掉。5 .找出Temp中大于85得值將其設(shè)置為缺失值。6 . 創(chuàng)建一個(gè)air1包含兩個(gè)列q1, q2。用cbind函數(shù)添加到air中。7 .使用names函數(shù)查瞧air得列名,并根據(jù)列自己創(chuàng)建一個(gè)數(shù)據(jù)框。使用r bind函數(shù)添加到air中實(shí)驗(yàn)要求要求學(xué)生會(huì)用subse
7、t獲取子集,學(xué)會(huì)對(duì)缺失值進(jìn)行一些簡(jiǎn)單得處理與對(duì)一些異常值得查找與修改。實(shí)驗(yàn)六高級(jí)數(shù)據(jù)管理實(shí)驗(yàn)?zāi)康? .學(xué)會(huì)簡(jiǎn)單得數(shù)值與字符處理函數(shù)。2 .學(xué)會(huì)自己編寫一個(gè)函數(shù)。實(shí)驗(yàn)內(nèi)容1 .使用下面代碼創(chuàng)建roster數(shù)據(jù)集。Student <- c("John Davis", "Angela Williams","Bullwinkle Moose", "David Jones","Janice Markhammer", "Cheryl Cushing","Reuven Yt
8、zrhak", "Greg Knox", "Joel England","Mary Rayburn")Math <- c(502, 600,412, 358,495, 512,410, 625, 573, 522)Science <- c(95, 99, 80, 82, 75, 85, 80, 95, 89, 86)English <- c(25, 22, 18, 15, 20, 28, 15, 30, 27, 18)roster <- data 、frame(Student, Math, Scien
9、ce, English, stringsAsFactors=FALSE)2 .使用length函數(shù)查瞧Student得長(zhǎng)度。3 .計(jì)算該班級(jí)數(shù)學(xué)得平均成績(jī),最高成績(jī)。4 .將成績(jī)單按照姓與名進(jìn)行排序,將學(xué)生得各科考試成績(jī)組合為單一得成 績(jī)衡量指標(biāo)、基于相對(duì)名次(前20%,下20%,等等)給出從A到F得評(píng)分。1) 使用quantile 函數(shù)按20%,40%,60%,80獻(xiàn)分位數(shù)。2) 使用變量重命名得方法將grade列分為A、B C D F幾個(gè)等級(jí)。3) 使用strsplit 函數(shù)將Student列得名字分割,存到name中。4) 創(chuàng)建一個(gè)函數(shù)x1,功能為實(shí)現(xiàn)返回值為傳入?yún)?shù)得第一個(gè)值。5) 使
10、用sapply 函數(shù)將name中得firstname 提取出來(lái)。(“sapp ly(data,function) ” )同理即可提取出 lastname。6) 將 lastname 與 firstname 與 roster 合并,同時(shí)去掉 roster 得 第一列。7) 將成績(jī)單用姓與名進(jìn)行排序。實(shí)驗(yàn)要求要求學(xué)生學(xué)會(huì)一些簡(jiǎn)單得數(shù)值與字符處理函數(shù)。學(xué)會(huì)如何自己創(chuàng)建一個(gè)函數(shù)。與對(duì)一些簡(jiǎn)單問(wèn)題得處理。實(shí)驗(yàn)七 基本統(tǒng)計(jì)分析實(shí)驗(yàn)實(shí)驗(yàn)?zāi)康? .學(xué)會(huì)使用summary函數(shù)與Hmisc包中得describe函數(shù)來(lái)計(jì)算統(tǒng)計(jì)量。2 . 使用 table 函數(shù)生成一維、二維、多維列聯(lián)表。3 .學(xué)會(huì)用R實(shí)現(xiàn)卡方獨(dú)立性
11、檢驗(yàn)。4 .學(xué)會(huì)用R進(jìn)行相關(guān)性得度量。5 .學(xué)會(huì)用 R進(jìn)行 Pearson、Spearman與 Kendall 相關(guān)。6 .學(xué)會(huì)用R進(jìn)行相關(guān)性得顯著性檢驗(yàn)。7 .學(xué)會(huì)用R進(jìn)行組間差異得非參數(shù)檢驗(yàn)。實(shí)驗(yàn)內(nèi)容1. 描述性統(tǒng)計(jì)分析1)對(duì)R自帶得數(shù)據(jù)集rock (48塊石頭得形態(tài)數(shù)據(jù))使用summary函數(shù)、 Himisc 包中 得 describe 函數(shù)、 pastecs 包中得 stats 、 desc 函數(shù)計(jì) 算描述性統(tǒng)計(jì)量。2) 使用 aggregate、 doby 中得 summaryBy對(duì) sleep 數(shù)據(jù)集得 group 歹!J 分組獲取描述性統(tǒng)計(jì)量。2. 頻數(shù)表與列聯(lián)表1) 加載 vc
12、d 包中得 Arthritis 數(shù)據(jù)集使用table 生成簡(jiǎn)單得頻數(shù)統(tǒng)計(jì)表。2) 使用 table 、 xtabs 對(duì) Arthritis 生成二維列聯(lián)表。并使用 addmargins為這些表格添加邊際與( 根據(jù) Treatment 、 Improved)。3) 使用 xtabs,table 生成三維列聯(lián)表( 根據(jù) Treatment 、 sex、 Improved三個(gè)因子 ) 。4) 使用chisq 、 testhan() 函數(shù)對(duì)二維表得行與列進(jìn)行卡方獨(dú)立性檢驗(yàn),并觀察她們就是否獨(dú)立。5) 使用 vcd 包中得 assocstats() 函數(shù)計(jì)算二維列聯(lián)表得phi 系數(shù)、列聯(lián)系數(shù)與Cramer s V 系數(shù)。3. 相關(guān)1) Pearson、Spearman與 Kendall 相關(guān)a) 對(duì) state 、 x77 數(shù)據(jù)集計(jì)算方差與協(xié)方差、Pearson 積差相關(guān)系數(shù)、Spearman等級(jí)相關(guān)系數(shù)。b) 使用 psych 包中得 corr 、 test 對(duì) state 、 x77 數(shù)據(jù)集 Illiteracy 、 Murder 因子計(jì)算相關(guān)顯著性檢驗(yàn)4. T檢驗(yàn)1) 比較了南方( group 1 ) 與非南 方 ( g
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年 上海寶山區(qū)社區(qū)工作者招聘考試筆試試題附答案
- 2025年 懷化麻陽(yáng)苗族自治縣招聘事業(yè)單位工作人員考試試題附答案
- 2025年 漢陰縣職業(yè)技術(shù)教育培訓(xùn)中心招聘考試筆試試題附答案
- 2025年 福建信息職業(yè)技術(shù)學(xué)院招聘考試筆試試題附答案
- 2025年中國(guó)定制門窗行業(yè)市場(chǎng)深度分析及未來(lái)發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 中國(guó)影音設(shè)備行業(yè)市場(chǎng)全景調(diào)研及投資規(guī)劃建議報(bào)告
- 2024年中國(guó)電解氯化氫行業(yè)市場(chǎng)調(diào)查報(bào)告
- 中國(guó)甜菜行業(yè)發(fā)展?jié)摿︻A(yù)測(cè)及投資戰(zhàn)略研究報(bào)告
- 2019-2025年中國(guó)低溫肉制品市場(chǎng)行情動(dòng)態(tài)分析及發(fā)展前景趨勢(shì)預(yù)測(cè)報(bào)告
- 中國(guó)單色數(shù)字示波器行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告(2024-2030)
- 風(fēng)場(chǎng)前期相關(guān)windpro2中文版幫助文件
- GB/T 12149-2017工業(yè)循環(huán)冷卻水和鍋爐用水中硅的測(cè)定
- 成都小升初數(shù)學(xué)分班考試試卷五
- Q∕SY 01007-2016 油氣田用壓力容器監(jiān)督檢查技術(shù)規(guī)范
- 水利水電 流體力學(xué) 外文文獻(xiàn) 外文翻譯 英文文獻(xiàn) 混凝土重力壩基礎(chǔ)流體力學(xué)行為分析
- 零星維修工程項(xiàng)目施工方案
- 物流公司超載超限整改報(bào)告
- 起重機(jī)安裝施工記錄表
- 江蘇省高中學(xué)生學(xué)籍卡
- 碳排放問(wèn)題的研究--數(shù)學(xué)建模論文
- 贏越酒會(huì)講解示范
評(píng)論
0/150
提交評(píng)論