【R語言基礎】01.R語言軟體環境搭建及常用操作

一、R語言簡介

R語言是專業的統計分析軟體,來自著名數據科學網站(kdnuggets.com/)發起的一個2016年統計分析和數據挖掘軟體使用情況的調查結果:

表明R語言是該領域近年來最受歡迎的軟體。

R語言的優勢:

(1) 免費開源,軟體體積小根據需要安裝擴展包,兼容各種常用操作系統;

(2) 專門為統計和數據分析開發的語言,有豐富的擴展包;

(3) 擁有頂尖水準的製圖功能;

(4) 面向對象,簡單易學。

缺點:內存管理機制較差,不擅長處理循環,跑大數據量的程序速度慢。

二、R語言軟體平台搭建

到R語言官網r-project.org/ 或鏡像站:

The Comprehensive R Archive Network

下載最新版安裝,安裝時可選擇32或64位版本。

安裝R語言集成開發環境Rstudio,下載地址:

rstudio.com/products/rs

圖1 RStudio操作界面

三、擴展包常用操作

1. 查看已安裝的程序包

(.packages())

:程序包默認安裝在…RR-3.3.1library目錄。

2. 載入程序包

library(RMySQL)

若沒有安裝該包,則會提示錯誤:

Error in library(RMySQL) : 不存在叫『RMySQL』這個名字的程輯包

3. 安裝程序包

務必先修改鏡像:

【Tools】—【Global Options…】,在Options窗口點「Packages」,修改CRAN mirror為

China(Beijing 4) [https] - TUNA Team, Tsinghua University

命令安裝:

install.packages("RMySQL")

註:若命令安裝失敗,則需要下載擴展包手動安裝。

4. 刪除擴展包

remove.packages("RMySQL")

5. 更新包

update.packages()

更新所有已安裝的包。

四、R語言常用操作

1. 幫助help:help(函數名) 或者 ? 函數名

使用R幫助是一種快速學習和掌握R的有效方法。

2. 命令窗口清屏:Ctrl + L

3. 清除當前內存變數:rm(變數名)

清除所有變數:rm(list=ls(all=TRUE)),或者RStudio中,【Session】——【Clear Workspace…】

4. 獲取或設置當前工作目錄

getwd()[1] "C:/Users/Administrator/Documents"setwd("E:/辦公資料/R語言/R語言學習系列/codes")getwd()[1] "E:/辦公資料/R語言/R語言學習系列/codes"

注意:路徑地址中的「」必須用「/」 或「\」代替。

5. 保存和載入數據

save函數將工作空間中的數據保存為R語言數據文件(默認格式為.Rdata ),load函數載入R數據文件。

setwd("E:/辦公資料/R語言/R語言學習系列/codes/") a<-1:10a [1] 1 2 3 4 5 6 7 89 10 save(a,file="adata.Rdata") #保存到當前路徑下,也可以使用絕對路徑load("adata.Rdata") #載入當前路徑下的數據文件,也可以使用絕對路徑

6. 腳本文件的輸入和輸出

(1) 在當前會話中執行一個腳本(中的R語句),常用於將某個函數打包調用:

source(「路徑/腳本文件.R」)

(2) 將輸出重定向到文件「文件名.txt」中(文本輸出),若文件已經存在,則它的內容將被覆蓋:

sink(「路徑/文件名.txt」)

使用參數append=TRUE可以將文本追加到文件後,而不是覆蓋它;參數split=TRUE可將輸出同時發送到屏幕和輸出文件中;

不加參數調用sink()函數將重回「僅向屏幕返回輸出結果」。

(3) 要重定向圖形輸出,使用下列函數即可,最後用dev.off()將輸出返回到終端:

函數

輸出

pdf("filename.pdf")

pdf文件

win.metafile("filename.wmf")

Windows圖元文件

png("filename.png")

png文件

jpeg("filename.jpg")

jpg文件

bmp("filename.bmp")

bmp文件

postscript("filename.ps")

PostScript文件

例如,執行代碼:

sink(「myoutput」,append=TRUE, split=TRUE)pdf(「mygraphs.pdf」)source(「script1.R」)

腳本文件script1.R中的代碼將執行,結果也將顯示在屏幕上,另外,文本輸出將被追加到文件myoutput中,圖形輸出將保存到文件mygraphs.pdf中

繼續執行代碼:

sink()dey.off()source(「script.2」)

腳本文件script2.R中的代碼將執行,結果顯示在屏幕上(此時不再有文本或圖形輸出)。

7. 賦值

注意R語言中賦值不是用「=」,而是「<-」或「->」,例如

x <- 1:10

R也允許用「=」賦值,但不是標準語法,有時會出問題。

R是一種基於對象的語言,即在定義類的基礎上,創建與操作對象;數值向量、函數、圖形等都是對象。

主要參考文獻:

  1. 張良均,謝佳標,楊坦,肖剛. R語言與數據挖掘. 機械工業出版社,2016.

  2. R常見問題解答——153分鐘學會R. 2008.

作者:張敬信

著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

推薦閱讀:

Learn R | 機器學習中的人工神經網路(二)
knn到底咋回事?(修改版)
北京歷史天氣可視化
在 R 中使用 Prophet
Learn R | 機器學習中的人工神經網路(一)

TAG:R编程语言 | 编程学习 |