【R語言基礎】01.R語言軟體環境搭建及常用操作
一、R語言簡介
R語言是專業的統計分析軟體,來自著名數據科學網站(http://www.kdnuggets.com/)發起的一個2016年統計分析和數據挖掘軟體使用情況的調查結果:
表明R語言是該領域近年來最受歡迎的軟體。
R語言的優勢:
(1) 免費開源,軟體體積小根據需要安裝擴展包,兼容各種常用操作系統;
(2) 專門為統計和數據分析開發的語言,有豐富的擴展包;
(3) 擁有頂尖水準的製圖功能;
(4) 面向對象,簡單易學。
缺點:內存管理機制較差,不擅長處理循環,跑大數據量的程序速度慢。
二、R語言軟體平台搭建
到R語言官網https://www.r-project.org/ 或鏡像站:
The Comprehensive R Archive Network
下載最新版安裝,安裝時可選擇32或64位版本。
安裝R語言集成開發環境Rstudio,下載地址:
https://www.rstudio.com/products/rstudio/download
圖1 RStudio操作界面
三、擴展包常用操作
1. 查看已安裝的程序包
(.packages())
注:程序包默認安裝在…RR-3.3.1library目錄。
2. 載入程序包
library(RMySQL)
若沒有安裝該包,則會提示錯誤:
Error in library(RMySQL) : 不存在叫『RMySQL』這個名字的程輯包
3. 安裝程序包
務必先修改鏡像:
【Tools】—【Global Options…】,在Options窗口點「Packages」,修改CRAN mirror為
China(Beijing 4) [https] - TUNA Team, Tsinghua University
命令安裝:
install.packages("RMySQL")
註:若命令安裝失敗,則需要下載擴展包手動安裝。
4. 刪除擴展包
remove.packages("RMySQL")
5. 更新包
update.packages()
更新所有已安裝的包。
四、R語言常用操作
1. 幫助help:help(函數名) 或者 ? 函數名
使用R幫助是一種快速學習和掌握R的有效方法。
2. 命令窗口清屏:Ctrl + L
3. 清除當前內存變數:rm(變數名)
清除所有變數:rm(list=ls(all=TRUE)),或者RStudio中,【Session】——【Clear Workspace…】
4. 獲取或設置當前工作目錄
getwd()[1] "C:/Users/Administrator/Documents"setwd("E:/辦公資料/R語言/R語言學習系列/codes")getwd()[1] "E:/辦公資料/R語言/R語言學習系列/codes"
注意:路徑地址中的「」必須用「/」 或「\」代替。
5. 保存和載入數據
save函數將工作空間中的數據保存為R語言數據文件(默認格式為.Rdata ),load函數載入R數據文件。
setwd("E:/辦公資料/R語言/R語言學習系列/codes/") a<-1:10a [1] 1 2 3 4 5 6 7 89 10 save(a,file="adata.Rdata") #保存到當前路徑下,也可以使用絕對路徑load("adata.Rdata") #載入當前路徑下的數據文件,也可以使用絕對路徑
6. 腳本文件的輸入和輸出
(1) 在當前會話中執行一個腳本(中的R語句),常用於將某個函數打包調用:
source(「路徑/腳本文件.R」)
(2) 將輸出重定向到文件「文件名.txt」中(文本輸出),若文件已經存在,則它的內容將被覆蓋:
sink(「路徑/文件名.txt」)
使用參數append=TRUE可以將文本追加到文件後,而不是覆蓋它;參數split=TRUE可將輸出同時發送到屏幕和輸出文件中;
不加參數調用sink()函數將重回「僅向屏幕返回輸出結果」。
(3) 要重定向圖形輸出,使用下列函數即可,最後用dev.off()將輸出返回到終端:
函數
輸出
pdf("filename.pdf")
pdf文件
win.metafile("filename.wmf")
Windows圖元文件
png("filename.png")
png文件
jpeg("filename.jpg")
jpg文件
bmp("filename.bmp")
bmp文件
postscript("filename.ps")
PostScript文件
例如,執行代碼:
sink(「myoutput」,append=TRUE, split=TRUE)pdf(「mygraphs.pdf」)source(「script1.R」)
腳本文件script1.R中的代碼將執行,結果也將顯示在屏幕上,另外,文本輸出將被追加到文件myoutput中,圖形輸出將保存到文件mygraphs.pdf中
繼續執行代碼:
sink()dey.off()source(「script.2」)
腳本文件script2.R中的代碼將執行,結果顯示在屏幕上(此時不再有文本或圖形輸出)。
7. 賦值
注意R語言中賦值不是用「=」,而是「<-」或「->」,例如
x <- 1:10
R也允許用「=」賦值,但不是標準語法,有時會出問題。
R是一種基於對象的語言,即在定義類的基礎上,創建與操作對象;數值向量、函數、圖形等都是對象。
主要參考文獻:
- 張良均,謝佳標,楊坦,肖剛. R語言與數據挖掘. 機械工業出版社,2016.
- R常見問題解答——153分鐘學會R. 2008.
作者:張敬信
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。推薦閱讀:
※Learn R | 機器學習中的人工神經網路(二)
※knn到底咋回事?(修改版)
※北京歷史天氣可視化
※在 R 中使用 Prophet
※Learn R | 機器學習中的人工神經網路(一)