第二篇——用幾分鐘了解R語言入門知識(續)

第二篇——用幾分鐘了解R語言入門知識

上一篇,講了入門R需要了解的四大金剛。。。的一半。

命令行——寫代碼用的

數據對象——暫時只需要記住向量(vector)、列表(list)、數據框(data frame)

函數——重要!馬上講。

par——馬上講。

六、函數

在R裡面,我們每天都在和函數打交道。

但函數究竟是什麼?我希望大家先記住一個函數,叫做function()

正所謂太極生兩儀,兩儀生四象。R中本來並沒有那麼多函數,然而R給我們提供了兩樣東西——一系列基本函數,以及一個叫做function()的造物金手指

看看上面的代碼就能明白function()的作用。

sum()和length()這些也同樣是函數,它們是R留給我們的小零件,每個小零件能獨立發揮作用。現在我們把它們拼在一起,就能構成一架更加強大的大機器。而function()就是拼裝這些零件所要用到的「金手指」。

事實上,除去那些小零件以外,所有的函數都是這樣創造出來的。

看到這裡,函數的定義不言自明。因為我們發現,用function()這個「金手指」創造一個函數,需要的是兩件東西:

一個是構成函數的零件,還有一個是輸入值(上例中的x)

函數就是一台這樣的機器。它將輸入的東西,經過各種加工,變成我們想要的東西。

七、par()——數據可視化的起點

估計能看到這個地方的讀者,一定很疑惑。par這個名詞,看字面根本看不出是什麼意思。然而我一說數據可視化,大家就明白了:「哎,不就是三大件之一嘛。為啥要換個這種奇怪的名字?」

那是因為。。數據可視化的內容實在是太雜亂了。

我們可以列出兩個向量,畫散點圖。可以畫關於一個向量分布的直方圖。也可以針對回歸分析畫qqplot對回歸的正態性假設做檢驗,或者畫crplot......好了我知道你們一臉懵逼。

這四個圖乾的都不是同一件事情,甚至相差甚遠。然而他們同樣都屬於數據可視化的範疇。所以說呢,數據可視化很難找到一個統一的主題進行總結,畢竟它無處不在。

所以我退而求其次,選了par()函數。

為什麼呢?是因為,這是一個只要進行數據可視化,就一定要用到的函數。它控制著在R的圖表區里出現的每一幅圖表的每一個細節,諸如字體、大小、坐標軸上下限、點和線的長相等等。。。

而且,它的操作手冊內容也是多到讓人沒眼看。別指望一次背下來,還是等到要用的時候,再去找相關的功能比較靠譜。

譬如上面的四幅圖,想要讓他們出現在一個版面上,就要通過語句par(mfrow=c(2,2))來實現。

在學習R過程中,我也在努力地翻譯par的操作手冊。等到哪一天基本所有的細節全部用到了,你們就能看到我的翻譯了。現在,由於我足夠懶,你們就自己去讀讀英文幫助文件,感受一下吧。。(方法:在R中輸入「help(par)」或者「?par」。你們可以通過類似的方法查詢任何函數的幫助文件。)

更新:正好,我在知乎上找到一位朋友的文章,正是@Canis lupus 關於par()操作手冊的中文版。大家有興趣可以去讀一讀,鏈接:R 學習筆記: Par 函數。在此感謝一下這麼好的資料~

筆記內容每天都在縮水,變得越來越不靠譜。然而這只是個開始,未來筆記裡面會更多地充滿代碼和簡略的註解,而不像現在一樣事無巨細地講。

畢竟,從一開始我就說了,不會走路,那就先走兩步,摔倒了再想想辦法。每一個學習R的朋友,智商都是不低的。在與代碼打交道的過程中,自然能夠迅速學會大量的內容,而不需要過多的講解。

(說白了就是我想偷懶。。。)

下一次,我們就要開始進入數據分析了。那將是R真正的核心,是我之前所說到的,真正的「套路」。

關於數據分析學習筆記的計劃(以及目錄)


推薦閱讀:

第二講實踐:數據結構入門
2017.07大數據入門學習計劃
編寫R語言的樂趣 --第二關:數據結構入門
HR Analyse
如何判斷一 部電影值不值得看?

TAG:R编程语言 | 数据分析 |