標籤:

第一關:大數據學習計劃和R語言初認識

自我介紹

我叫侯晉宇,是一名即將畢業的大四學生,本科專業是應用物理學,可能一聽是物理,恩,很難學,其實你要真真學起來,其實還是蠻有趣的,但是我自己是棄療的,大學期間基本是算是玩了四年,所以在大四上學期決定跨專業考研,轉學自己感興趣的電子信息學,也很慶幸的做到了。

之前是一直在準備畢業答辯的論文寫作修改,到五月底的時候大概論文方面的工作大概都已經完成結束,也是在和我姐聊天的時候得知「猴子聊人物」的微信公眾號,一開始並不知道是做什麼的,於是我翻開以前的歷史記錄,了解到大數據的發展,又想到和自己研究生期間學習的電子信息學其實是密不可分的,所以何不好好利用暑假的時間學習新東西呢?於是果斷決定加入大數據社群,一方面,自知自己的意志力比較差,如果無腦的在網上找視頻、找資料學習,那結果我自己都能想像得到,三分鐘熱度,毫無目的,一片迷茫,而加入社群就不一樣了,有先輩們的一套方法經驗,對自己來說是很好的參考和學習;另一方面,有一群熱愛學習的人在一起對自己也是一種激勵。下面我介紹一下自己對大數據的了解以及學習計劃。

大數據初認識

大數據這個詞記得是在大三下學期我們選修的一門課程:工業企業管理,講課老師提了一下大數據這個詞,當時並沒有在意,關注了「猴子聊人物」公眾號,聽了入門課程中猴子的講解,才開始對大數據這個行業有了新的認識,也從中大概了解到了一些關於大數據的知識。

阿爾法狗和何潔圍棋比賽結果想必很多人也猜出來了,機器越來越智能,深度學習讓機器看起來似乎超越了人類,何潔的失敗不是他的棋藝不行,只能說是機器的進步,人工智慧正步入快速發展的快車道,不過可能時間周期會比較長,但這是後互聯網時代的必然發展趨勢,人工智慧背後就隱藏著大數據的身影,阿爾法狗的成功也正是機器對所有的棋術的自我學習,對數據的整合、分析,從而走好每一步棋。我覺得以後的生活會更多的應用到大數據,大數據也正滲入到生活的方方面面,尤其是在中國,基數特別大,數據也特別多,這麼多的數據其中蘊藏著很多的規律,所以對於這些數據的研究很有必要。

R語言初認識

R語言對自己來說是一個新鮮的計算機語言,之前簡單的學習過C語言,自己也是花了幾個小時的時間把群里資料第一關裡面的R語言實戰的電子書看了一下,因為也是剛開始學,所以只是把第一章最後的代碼1-3關於關節炎治療情況和治療結果,試著用R語言運行了一下,實踐結果如下:

1、help.start()

運行之後直接打開了一個網頁,裡面是對R軟體的各種介紹。

2、install.packages("vcd")

輸入這個命令後出現的是:CRAN mirror,意思是選擇一個鏡像站點下載需要的包,最好是離你的所在地最近的站點,這樣載入會比較快點,因為我是在南京,所以選擇了最近的China(Hefei);也可以直接在R軟體的上方工作欄中的『程序包』中找到『安裝程序包』,省去了手動輸入命令的麻煩。

然後在再次跳出來的框中找到:vcd這個包,下載安裝好就OK了。

3、help(packages="vcd")

跳出一個網頁,有關於對vcd這個包的詳細介紹

4、library(vcd)

library指令用來載入之前安裝好的vcd包

5、help(Arthritis)

Arthritis

有關於「關節炎治療」的相關數據,包括有樣本量、身份、性別、年齡以及治療的情況,

6、example(Arthritis)

依次出現了三張圖,最後很形象做了一個淺顯易懂的圖形,比起直接分析數據更容易讓人得出其中的規律。

上面也算是自己的一個小小嘗試,可見將一堆複雜的數據用R語言的幾行代碼就可以得出一個很形象的圖形,從而進行分析,最好可以得出對於關節炎治療的情況,所以我覺得繼續深學下去會發現更多的新東西。在群里看到很多闖到後面幾關的各個會員發的作業,感覺自己要向他們學習,作為初學者,還是要堅持學習吧,畢竟剛開始入門,以後學習的東西還很多,和這麼多優秀的人一起學習,對自己也是一個很好的提高!

學習計劃

上述是制定的在暑假6月到9月期間的學習計劃,當然其中會參差學習《深入淺出統計學》、《深入淺出SQL》的相關課程,計劃趕不上變化,但是自己保證完成上述任務,每天記錄自己的學習情況,做好筆記,希望大家監督。


推薦閱讀:

大數據下的中國女人,看完驚呆了
筆記 | 如何選擇一個靠譜的物聯網平台
2016年寵物行業最新發展現狀大數據【圖】
[引子]政務大數據的七大痛點
移動計算比移動數據更划算 - 大數據技術源起

TAG:大數據 |