




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2.1數(shù)據(jù)導(dǎo)入2.1.1直接輸入數(shù)據(jù)2.1.2導(dǎo)入CSV數(shù)據(jù)2.1.3導(dǎo)入EXCEL數(shù)據(jù)2.1.4導(dǎo)入數(shù)據(jù)庫數(shù)據(jù)2.1.5導(dǎo)入其他統(tǒng)計(jì)工具數(shù)據(jù)2.1.6導(dǎo)入在R中的數(shù)據(jù)2.1.7導(dǎo)入互聯(lián)網(wǎng)數(shù)據(jù)語文數(shù)學(xué)英語政治8580829087839092837786908075788588909178788887NA8081838983798084一個(gè)簡單數(shù)據(jù)集:8個(gè)學(xué)生的各科平均成績2.1.1直接輸入數(shù)據(jù)Chinese1<-85Chinese2<-87Chinese3<-83Chinese4<-80Chinese5<-88Chinese6<-78Chinese7<-80Chinese8<-83以標(biāo)量的形式將這些數(shù)據(jù)一一輸入用c()函數(shù)將多個(gè)值保存在一個(gè)變量當(dāng)中Chinese<-c(85,87,83,80,88,78,80,83)TIPS:集成開發(fā)環(huán)境2.1.2導(dǎo)入CSV數(shù)據(jù)read.tablemydataframe<-read.table(file,header=logical_vaule,sep=”delimiter,s=”name”)file參數(shù):這是必須的,可以是相對路徑或者絕對路徑(注意:Windows下路徑要用斜杠'/'或者雙反斜杠'\\')。header參數(shù):默認(rèn)為FALSE即數(shù)據(jù)框的列名為V1,V2...,設(shè)置為TRUE時(shí)第一行作為列名。sep參數(shù):分隔符,默認(rèn)為空格。可以設(shè)置為逗號(comma)sep=',',分號(semicolon)sep=';'和制表符(tab)。s是一個(gè)可選參數(shù),用以指定一個(gè)或多個(gè)表示行標(biāo)識的變量。results<-read.table("result.csv",head=TRUE,sep=",")#導(dǎo)入數(shù)據(jù)results
語文數(shù)學(xué)英語政治1858082902878390923837786904807578855889091786788887NA780818389883798084一個(gè)result.csv文件2.1.3導(dǎo)入excel數(shù)據(jù)
1)先轉(zhuǎn)為CSV文件,再按上節(jié)內(nèi)容進(jìn)行導(dǎo)入;2)使用RODBC包來訪問Excel文件,再通過odbcConnectExcel()進(jìn)行導(dǎo)入install.packages(“RODBC”)library(RODBC)channel<-odbcConnectExcel(“d:/Rbook/myfile.xls”)mydataframe<-sqlFetch(channel,“mysheet”)odbcClose(channel)上例中的myfile.xls是一個(gè)excel文件,mysheet是要從這個(gè)工作簿中讀取工作表的名稱,channel是一個(gè)由odbcConnectExcel()返回的RODBC連接對象,mydataframe是返回的數(shù)據(jù)框。2.1.4導(dǎo)入數(shù)據(jù)庫數(shù)據(jù)對于一些需要長期更新、保存的大數(shù)據(jù),最好儲存在關(guān)系數(shù)據(jù)庫中,R中有很多面向關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(DBMS)的接口,包括MicrosoftSQLServer、MicrosoftAccess、MySQL、Oracle、PostgreSQL、DB2、Sybase以及SQLite等。我們可以通過不同的包來訪問這些數(shù)據(jù)庫中的數(shù)據(jù),比如RMySQL、ROracle、RPostgreSQL和RSQLite,這些包都為對應(yīng)的數(shù)據(jù)庫提供了原生的數(shù)據(jù)庫驅(qū)動。我們假設(shè)安裝mySQL時(shí),設(shè)置user為root密碼是六個(gè)1,并且已經(jīng)在mySQL中建立了一個(gè)名為test的數(shù)據(jù)庫,里面有一個(gè)表hi,里面有三個(gè)字段是name,age,sex則在R中查詢按照年齡降序排列的代碼如下:library(RMySQL)con<-dbConnect(MySQL(),user="root",password="111111",dbname="test")s<-dbListTables(con)s<-dbListFields(con,"hi")dbSendQuery(con,'SETNAMESgbk')#注意該行代碼是告訴通過什么字符集來獲取數(shù)據(jù)庫字段,gbk或者utf8與你當(dāng)初設(shè)置保持一致。res<-dbSendQuery(con,"select*fromhiorderbyage")dat<-fetch(res)datdbSendQuery(con,"insertintohivalues('阿明',28,'男')")res<-dbSendQuery(con,"select*fromhiorderbyage")dat<-fetch(res)dbDisconnect(con)2.1.5導(dǎo)入其他統(tǒng)計(jì)工具數(shù)據(jù)可以通過foreign包來對其他統(tǒng)計(jì)工具中的數(shù)據(jù)進(jìn)行導(dǎo)入。如導(dǎo)入SPSS數(shù)據(jù)可以用read.spss(),導(dǎo)入SAS數(shù)據(jù)用read.ssd(),導(dǎo)入Stata數(shù)據(jù)用read.dta(),示例如下:library(foreign)mydata<-read.dta(“myfile.dta”)2.1.6包含在R中的數(shù)據(jù)R的基本包里有一個(gè)datasets,里面包含了示例數(shù)據(jù)集,同時(shí)在其他一些包中也常含有一些數(shù)據(jù)集用于代碼的測試,使用data()函數(shù)可以查看所有已加載了的包的數(shù)據(jù)集:如果想調(diào)用數(shù)據(jù)集中的數(shù)據(jù),只需要通過data函數(shù),傳入數(shù)據(jù)集的名稱及其所在包名(如果此包已被加載,可省略這個(gè)packages參數(shù))。如調(diào)用上圖中最后一個(gè)數(shù)據(jù)集women:data(“women”)可以直接利用這些數(shù)據(jù)進(jìn)行繪圖操作:plot(women)2.1.7導(dǎo)入互聯(lián)網(wǎng)數(shù)據(jù)XML包中readHTMLTable()函數(shù)readHTMLTable(doc,header=NA,colClasses=NULL,skip.rows=integer(),trim=TRUE,elFun=xmlValue,as.data.frame=TRUE,which=integer(),...)download.file()函數(shù)download.file(url,destfile,method,quiet=FALSE,mode="w",cacheOK=TRUE,extra=getOption("download.file.extra"))主要的參數(shù)為:url:文件的所在地址destfile:下載后文件的保存地址,默認(rèn)為工作目錄method:提供"internal","wget","curl"和"lynx"四種method2.2數(shù)據(jù)輸出write.table()write.xlsx()sink()write.foreign()2.3圖形格式pdf()ggsave()Rstudio中的Export菜單常見的保存圖像輸出的函數(shù)列表函數(shù)輸出圖形pdf("filenam
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東省清遠(yuǎn)市連州市2023-2024學(xué)年五年級下學(xué)期數(shù)學(xué)期末監(jiān)測試卷(含答案)
- 仲秋促銷活動方案
- 企業(yè)之星活動方案
- 企業(yè)傳承活動方案
- 企業(yè)公司員工活動方案
- 企業(yè)參展活動方案
- 企業(yè)回訪活動方案
- 企業(yè)外聯(lián)活動方案
- 企業(yè)宣講雙選會活動方案
- 企業(yè)年末賀歲活動方案
- 出租車合租合同協(xié)議書
- 針對不同人群的中醫(yī)健康管理方案研究
- 2024-2025學(xué)年度七年級下學(xué)期人教版地理11 極地地區(qū)導(dǎo)學(xué)案
- 自動扶梯吊裝方案
- T-ZNZ 261-2024 丘陵山地桃園宜機(jī)化建設(shè)及管理技術(shù)規(guī)程
- 第5課 弘揚(yáng)勞動精神、勞模精神、工匠精神(教學(xué)設(shè)計(jì)) -【中職專用】中職思想政治《職業(yè)道德與法治》同步教學(xué)教學(xué)設(shè)計(jì)(高教版2023·基礎(chǔ)模塊)
- 2025年產(chǎn)科門診護(hù)理考試題及答案
- 地鐵客運(yùn)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 2025至2030年中國合成云母數(shù)據(jù)監(jiān)測研究報(bào)告
- 基于改進(jìn)YOLOv8n的水下魚類目標(biāo)識別輕量化模型
- 藥品儲存與養(yǎng)護(hù)課件
評論
0/150
提交評論