標籤:

R語言初實戰,數據結構 書本內容第一、二章

經過兩個多星期對R語言初步的摸索,和聽了猴子老師的第二關課程數據結構,現做如下三點分享:

一、猴子老師的作業在實踐過程中的一點感受;

1、讀取excel的病人數據

在這一過程中,自己一開始的操作是直接是通過Rstudio工作空間中的任務攔Import Dataset導入excel,在導入的過程中也不知道提示了安裝了一個包,就成功了;後來在群友的分享中知道了運用了一個比較方便的函數 read.csv(file.choose());後來自己實踐了一下確實比較方便,操作結構如下:

2、用合適的數據結構

在看了書本的內容和老師的課很自然的就知道了要用數據框的數據結構,同是數據框也是在我我們以後的數據分析中用的最多的一種數據結構。數據框的函數是data.frame(),是由不同的列構成的包含(字元型、數值型等),但每一行的模式必須是相同的,自己也實踐敲了一遍代碼,感覺對數據框這一數據結構的了解更深了一點。

3、對數據的儲存

我現在對數據的儲存暫時還停留在平台Rstudio本身,在後面的學習中應該還有一種比較好的方式。

4、進行簡單的數據分析

①查找 age1 <- patientdata$age

②選取其中一部分 subdata <- patientdata[c("diabetes","status")]

③有多少病人 patientdata.number <- nrow(patientdata)

④患有「1型糖尿病的患者」 type1 <- patientdata(patientdata$diabetes==「1型糖尿病的患者」,) type1.number <- nrow(type1)

在這一自己實踐的過程中由於最後面少了一個逗號,結果總出現錯誤。覺得有些東西看著覺得簡單,但在自己的實踐過程還是有一些不起眼的錯誤會發生導致結果的錯誤,這次經歷讓對實踐的重要性有了更深了一點。(ps:為什麼要用到兩個等於號,後面還必須要加一個逗號)

⑤曾加一個病人,實踐過程順利

⑥增加一列

在完成猴子老師的作業的過程中,自己犯了一寫錯誤,如 字母大小寫、在增加列輸入日期的的時候漏了一段時間、還有一些像逗號的忘寫,等下次的做作業自己一定要注意。

二、重新複習了R語言的第一、二章做了一些自己覺得重要的內容的整理

數據結構類型

其中向量函數c(), 矩陣函數matrix(vector,nrow,ncol,byrow=,dimnames=list()), 數組函數array(vector,dimension,dimnames), 數組函數data.frame(col1,col2,col3,······) 列表函數list(object1,object2,······)

三、對接下來的學習需要做的一些自我調整

實踐是最好的學習,在前面的兩個多星期時間的過程中,自己注意力還是沒有很好的投入到大數據的學習中,所以在接下來時間裡要更加專註的投入到學習中去;

在還沒有辦法支撐起自己的夢想的時候,學習是我們唯一能能夠走的一條捷徑。


推薦閱讀:

從三大關鍵詞解讀我國智能製造產業發展現狀
天搜科技:多平台被質疑用大數據殺熟
【如何和一個資料庫技術人員講清楚什麼是大數據】
ABC的關係(《Greenplum:從大數據戰略到實現》預覽)
大數據殺熟現象,用的越多越貴!

TAG:大數據 |