標籤:

簡單數據分析

在之前的計劃里並沒有考慮到上一周要考試,結果第三關的課程耽擱了一周才完成。

再說展示自己學到的成果之前,先說一下我在學習過程中遇到一些問題吧。

導入csv文件本來是第二章的內容,但我看到老師在課程里沒有講,我也就拖到了第三關里,但是在導入時,遇到了兩個問題。

1.怎麼將excel文件轉化成csv文件

如果直接將文件後綴改成csv,在導入時會提示錯誤,正確方法是把文件 另存為 csv 才可以運行成功。

2.導入的文件應該放在哪裡,總不能任何一個地方r都能訪問到吧

文件要放在r的當前工作目錄,而要獲得當前工作目錄,可以使用getwd()函數,(而使用setwd(「F:/r語言工作空間」)可以更改工作目錄),解決了這兩個問題,我才終於把數據導入成功。

當然了,如果使用openxlsx包的話,就不需要考慮上面的兩個問題了。

在跟著老師課程學習的時候依舊在不停的碰到很多問題。

1.首先是安裝包時出錯了,顯示如下內容:

我發現下載的安裝包不在R訪問的文件夾中,於是手動將解壓的文件放在了指定的文件夾里,才成功運行library(" ")。我想以後的所有包都需要手動更改文件目錄吧。

2.日期數利用%/%計算月份數時,又發生了如下錯誤:

在經過一番查找後,終於明白了是 日期沒有辦法用算數運算符進行計算,所以把日期值轉換成了數值類型

接下來就是第三關學到的知識總結了。

簡單的數據分析步驟如下:

1. 重命名,利用name函數

2. 處理缺失數據,使用 !is.na 將缺失值刪除

3. 轉化數據類型,根據市局的不同轉化成相應的數據類型,使用 class( ) 可以查看數據格式,利用 as.numeric( ),as.character( ),as.matrix( ),as.data.frame( )等來轉換

4. 對時間進行排序,使用order( )函數

5. 分析四個業務指標

##業務指標4:消費趨勢

不知不覺中,自己已經學到很多了,繼續加油!


推薦閱讀:

【數據獲取】文件讀取與R數據集
創建你自己的模型演算法-Gradient Descent
Learn R | 交互可視化之Plotly包(三)
R語言流量結構分布圖——炫酷和弦圖

TAG:R编程语言 |