用RStudio導入數據
01-26
目錄
- 簡介
- 導入數據
- CSV格式
- EXCEL數據
- SAS,SPSS或STATA格式
簡介
向R中導入數據是數據分析的必經之路,通常是非常令人煩躁的。為了簡化過程,RStudio提供了一個簡化模式,不用寫代碼,哈。可以導入一下格式的數據: csv, xls, xlsx, sav, dta, por, sas 和 stata 文件.
導入數據
數據導入功能可以通過兩種方式,1.environment pane 2.file菜單
導入的數據類型大概可以分為3類:
- 分割文件,主要以CSV文件為主
- 微軟的Excel文件
- 統計數據
導入CSV文件
CSV導入支持一下情況:
- 導入系統文件或者URL
- 修改某列的數據類型
- 跳過某列或只選某一列導入
- 數據集重命名
- 跳過第n列導入(排除某列不導入)
- 用首行作為列名
- 微調列名的空間
- 改變列的分隔符
- 編碼方式選擇
- 選擇 : 引號, 溢出, 注釋 或 NA 提示符
例如:https://data.montgomerycountymd.gov/api/views/6rqk-pdub/rows.csv?accessType=DOWNLOAD 作為URL,但後選擇導入"import",效果如下:
導入Excel 文件
導入Excel文件支持以下功能:
- 導入系統文件或URL
- 改變某列的數據類型
- 跳過某列導入
- 重命名數據集
- 選擇Excel具體的sheet導入
- 跳過第n行導入(排除某列導入)
- 選擇NA標識符
例如: http://www.fns.usda.gov/sites/default/files/pd/slsummar.xls 選擇"import".
1. 選擇跳過6行導入
2. "First Row as Names" 勾選
good,滿足要求,得到如下結果:
最後一步,點擊 "import" ,同時預覽代碼 "Code Preview",這樣數據就導入 RStudio, the final 結果是這樣的:
導入SPSS, SAS 和 Stata 文件
導入SPSS, SAS 和 Stata 支持以下功能:
- 導入本地系統數據和URL
- 重命名數據集
- 選擇數據類型
綜上:鑒於初學者對數據導入的具體參數不熟悉,可以通過此方式來導入各種類型的數據,同時也能通過調整導入參數來形象具體的理解各個參數的意義,然後呈現了具體的代碼,反哺代碼能力。
推薦閱讀: