用RStudio導入數據

目錄

  • 簡介
  • 導入數據
    • CSV格式
    • EXCEL數據
    • SAS,SPSS或STATA格式

簡介

向R中導入數據是數據分析的必經之路,通常是非常令人煩躁的。為了簡化過程,RStudio提供了一個簡化模式,不用寫代碼,哈。可以導入一下格式的數據: csv, xls, xlsx, sav, dta, por, sas 和 stata 文件.

導入數據

數據導入功能可以通過兩種方式,1.environment pane 2.file菜單

導入的數據類型大概可以分為3類:

  1. 分割文件,主要以CSV文件為主

  2. 微軟的Excel文件

  3. 統計數據

在 "Environment" 框中,點擊"Import Dataset"下拉菜單:

或者通過「File」菜單 中"Import Dataset" 下拉菜單:

導入CSV文件

CSV導入支持一下情況:

  • 導入系統文件或者URL
  • 修改某列的數據類型
  • 跳過某列或只選某一列導入
  • 數據集重命名
  • 跳過第n列導入(排除某列不導入)
  • 用首行作為列名
  • 微調列名的空間
  • 改變列的分隔符
  • 編碼方式選擇
  • 選擇 : 引號, 溢出, 注釋 或 NA 提示符

例如:data.montgomerycountymd.gov 作為URL,但後選擇導入"import",效果如下:

導入Excel 文件

導入Excel文件支持以下功能:

  • 導入系統文件或URL
  • 改變某列的數據類型
  • 跳過某列導入
  • 重命名數據集
  • 選擇Excel具體的sheet導入
  • 跳過第n行導入(排除某列導入)
  • 選擇NA標識符

例如: fns.usda.gov/sites/defa 選擇"import".

發現前幾行數據異常,希望將異常數據刪除:

1. 選擇跳過6行導入

2. "First Row as Names" 勾選

good,滿足要求,得到如下結果:

看上去還不錯哦,但是有些列本身屬於數字型數據,但是顯示的是字元型數據,我們可以通過選擇 "numeric" 列的下拉菜單來進行更正.

最後一步,點擊 "import" ,同時預覽代碼 "Code Preview",這樣數據就導入 RStudio, the final 結果是這樣的:

導入SPSS, SAS 和 Stata 文件

導入SPSS, SAS 和 Stata 支持以下功能:

  • 導入本地系統數據和URL
  • 重命名數據集
  • 選擇數據類型

綜上:鑒於初學者對數據導入的具體參數不熟悉,可以通過此方式來導入各種類型的數據,同時也能通過調整導入參數來形象具體的理解各個參數的意義,然後呈現了具體的代碼,反哺代碼能力。


推薦閱讀:

15分鐘學會數據地圖分析
《深入淺出數據分析》實踐案例
用ggplot2構造期待已久的雷達圖

TAG:R编程语言 | 数据分析 |