道可道之機器學習(2) - 透過數學看世界

系列回顧

道可道之機器學習(1) - 初探人工智慧

牛人界潛移默化形成的數學符號

為了方便牛人間的溝通,牛人界出現了很多數學符號和數學表達形式,雖然沒有進行嚴格的規範,但是大家也都是很好的遵守著。李耳腦子裡的這種約定俗成的符號和表達形式太多了,沒有辦法一股腦的倒出來,在後面的章節中會一點一點介紹給大家。

函數/映射:

一個小寫字母后面跟一個括弧通常表示為一個函數,有的牛人也叫做映射,括弧裡面放著變數,多變數之間用逗號隔開。如果只有一個變數,可以不寫。

上下標:

上下標表示"第幾個",矩陣中表示"第幾行第幾列",具體採用上標還是下標看個人喜好了。如下的函數,x_1代表第一個變數, x_2代表第2個變數,如果看不順眼換成 x,y,z也是可以的,完全看個人喜好,兩個函數表達的意思完全一致,不要因為幾個下標而覺得很高深的樣子。

等號:

等號表示左右的內容是完全一樣的,可以進行替換。公式特別長的時候,使用等號給這個公式取一個別名,後面的過程中都使用別名來代替就好,完全為了圖方便。

集合:

集合用大括弧表示。大括弧中間裝著集合中所有的元素:

數學符號五花八門,同樣的符號在不同的上下文又有著完全不一樣的意思,碰到沒見過的數學表達形式,可以通過上下文大膽的猜測,只要上下文通順,一般都不會錯的。

使用向量空間來描述這個世界

李耳問身邊的童子"世界是幾維的?"。 童子秒答"四維的!"。童子美滋滋,覺得簡單的四維世界盡在掌握。

童子僅僅將日常生活中接觸最多的長,寬,高,時間四個特徵來描述世界,這是片面的。世界還有很多很多的特徵,比如地球村平均溫度,黨國人民生活幸福指數,道瓊斯指數,某牛逼星球上的外星人幸福指數等等。僅僅用長,寬,高,時間來描述世界,顯然太狹隘了。

我們可以把世界看成是一個向量空間(本質就是一個集合),這個空間中的元素是很多很多種特徵值組成的一個組(向量)。"世界"向量空間中的每一個向量代表"世界"的一個狀態,這個集合盛放了"世界"所有可能的狀態。世界在這個集合中所有狀態之間切換。

"世界"向量空間的數學符號:

李耳的道德經火了後,皇帝賞了一把傘給他,這哥們可樂壞了,整天盼著下雨後拿出來秀一下。現在李耳最關心的問題是世界切換到哪個狀態下河南下雨量可以大一點並且河南颳風級數小一點,其它的亂七八糟的屬性都不在意。因此李耳可以將"世界"這個向量空間中的向量除了"河南下雨量"、"河南颳風級數"的其它屬性恆置為零,這就構成了"世界"這個向量空間的向量子空間 -河南颳風下雨"世界"向量子空間。子空間中的向量個數瞬間少了很多很多很多。

河南颳風下雨"世界"向量子空間的數學符號:

進一步思考,既然其它屬性在李耳想秀一下皇帝給他的傘這件事上都可以忽略,那我們還緊緊抓住"世界"這個向量空間幹啥呢。我們重新構建一個"河南颳風下雨界"向量空間,這個向量空間的屬性只有河南下雨量和河南颳風級數。

"河南颳風下雨界"向量空間

使用矩陣來顯示世界中各屬性之間的映射關係

李耳等了幾天,他期盼的下大雨而不颳風的世界還沒有切換到。"無為"的他,得到的並不是"無所不為",作為太上老君,他面子往哪裡放!李耳從世界向量空間中分析出了一個很厲害的屬性:撒乾冰,組成了新的向量空間 - 撒乾冰向量空間,掐指算下需要灑下的乾冰數量後往空中撒了乾冰。河南終於下雨了並且沒有颳風!

矩陣有兩層作用,第一層是盛放數據的容器,第二層含義是向量空間間的映射。為了解決下雨不颳風這個問題,李耳灑下了5噸乾冰(驅使他做這件事情的是念力,量子力學-玄學範疇,在這裡不糾結),撒乾冰向量空間切換到了5噸的狀態: 向量(5),將向量轉換成矩陣用來盛放數據。

灑下乾冰量矩陣:

李耳作為太上老君還是很有實力的,他掐指算出了一個矩陣,該矩陣可以把撒乾冰向量空間中的向量映射到颳風下雨向量空間(如果是平凡的人類,則需要通過機器學習使用大量的歷史數據來算出這個矩陣),通過這個矩陣他算出了要灑下5噸的乾冰,這樣颳風少還會下大雨。

撒乾冰-下雨颳風映射:

(撒乾冰-下雨颳風映射)點乘(灑下的乾冰矩陣) = (颳風下雨矩陣)

如下是將數學公式從我們熟悉的形式到矩陣形式轉換:

矩陣間的運算不僅僅只有點乘,還有加、減、標量乘。至於矩陣的加法減法和標量乘的運算比較容易理解,就不展開講解了。

機器學習的本質

針對買房子這個問題,一部分屬性是很容易得到的或者預測到的,比如房子的面積、朝向、地理位置(這些屬性完全取決於我們內心的期望,所以很容易得到)。但是房子價位是多少,這是房地產商定的,我們沒有辦法左右。通過機器學習,我們不需要挨個樓盤去問就可以知道一個大約的價位。機器學習的本質就是得到一個矩陣可以將已知的屬性(面積、朝向、地理位置)映射到未知的屬性(房價),從而解決我們的問題。

預告

下一篇文章將給大家實現一個含有一個隱藏層的神經網路。

推薦閱讀:

機器學習導論——Day1
膠囊網路(Capsule Networks)學習資源匯總
斯坦福機器學習筆記10密度分布估計の混合高斯模型
Fisher Linear Discriminant Analysis(Fisher線性判別分析)
VC眼中的人工智慧!

TAG:人工智慧 | 機器學習 | 神經網路 |