道可道之機器學習(1) - 初探人工智慧

初探老子的神經系統

老子,姓李名耳,偉大的思想家哲學家。牛逼的李耳走出門口時他的坐騎(牛)正對著他,看到牛的李耳有點生氣了, 因為按照慣例牛兄會哞哞的叫幾聲來表達對他的喜歡, 今天這是什麼個情況?難道牛兄不喜歡我了?李耳腦袋開始犯嘀咕了。

(1)李耳是怎麼"感覺"到了牛兄的存在呢?

照射在牛身上的光反射到了老子的眼睛, 眼睛將信息轉換成電信號傳遞到大腦皮層視覺區的V1區(可以識別簡單的視覺場景, 比如尖狀物, 顏色差距等), 這時V1區部分細胞被激活(我的理解就是通電了); 激活的細胞再將信號傳遞給V2區(可以識別的場景更為複雜, 具體是啥不在細究), 這時V2區的部分細胞又被激活了; 就這樣持續傳遞到V3區、V4區等等其他的一些區, 最終轉到聯合區。大腦皮層的聯合區就比較厲害了, 它可以將所有的感覺(視覺, 聽覺, 觸覺等)混合在一起, 比如你看到一頭牛激活了聯合區的細胞1至100, 那同樣你聽到牛叫可能激活細胞4至96, 這兩個的相似度就非常近了。這樣一個牛就被老子看到了(其實這裡說被感覺到了會更準確)。

談起"看到"這個詞, 我們第一反應就想到了眼睛。其實真正看到牛的不是老子的眼睛,而是他的腦袋 - 處在黑乎乎的頭蓋骨下面的腦袋,。"看到", "聽到"這些詞的劃分僅僅來自於人體接受外界信息物理狀態的不同(光, 聲音等), 最終到達大腦皮層的信息都是"被通電"的細胞。因此我們用"感覺到了牛"更準確。

如下是李耳大腦皮層的神經元, 穿越千年呈現在了我們面前 ^_^, 可以看到剛出生的李耳的大腦是一張白紙, 細胞之間幾乎沒有連接。隨著大腦的不斷學習, 細胞之間一直在進行連接的建立和重構,人的學習就是大腦皮層神經元之間連接的建立和重構的過程。

(2)李耳看到牛後為什麼會想起平時牛都會對著他叫呢?

裝在李耳腦袋裡所有記憶的結構是一個有向的網,學名叫片記憶。這種記憶方式使得李耳不可能瞬間把腦袋裡所有的記憶都拿出來回顧一下,他的記憶只能被一個場景觸發,然後與其相關聯的記憶被喚醒。如果他處於冥想階段,他可以使用被喚醒的記憶繼續喚醒新的記憶,這樣一層一層的傳遞下去。同樣李耳只要沒有睡覺,就會有源源不斷的新的記憶產生,這些記憶也會放在產生這個記憶相關的場景的後面。李耳的生活中牛和皇上從來沒有出現在同一關聯場景下,因此這兩個記憶沒有連接(這位老兄可以腦補一些畫面硬把皇上和牛放在一起也是可以的,這就是想像力了),但是之前的兩個月中牛見了李耳都會溫柔的哞哞的叫一下,李耳的記憶網牛和牛哞哞的叫的記憶已經連接在一起了,因此看到了牛就勾起了牛哞哞叫的記憶,而不會想起吾皇萬歲。

(3)李耳為什麼會生氣,為什麼感覺牛不喜歡他了

人類的大腦為啥會這樣呢,這個目前來說還是個迷。以下僅僅是本人為避免腦子引入"玄學"而強行扯出來的。

我們目前理解的世界是牛頓物理的世界,按照牛頓的理論,只要我們掌握了世界上每個粒子和他下一刻的運動軌跡,那麼後面的世界是什麼樣子都已經可以推斷出來了。這就等於說人的命運是註定的了,那我們還努力工作幹啥啊,這顯然是不合理的,因此可以推斷牛頓物理世界不是這個世界的全部。目前比較火的量子力學講求"念力", 聲稱可以補充牛頓物理的世界, 也許這玩意可以解釋, 誰知道呢, 講科學的人需要把沒解決的問題歸類到未解決的科學裡, 我們暫且把他強行歸到這一類, 避免腦子裡出現"玄學"這個詞。(PS: 我不是民間科學家)

計算機上的神經網路。

仿照人類的神經網路(僅僅是目前醫學界理解的,可能多年後發現更高級的,那都是後話了), 大牛們在計算機上搞了一套神經網路,直接上圖:

其中圓圈代表神經元,圓圈間的連線代表神經元間的鏈接。一個神經網路包含輸入層、隱藏層、輸出層。

輸入層: 可以理解為要進行處理的原始數據, 通常我們用x表示, 為了方便區分, 加一個下標代表第幾個神經元。比如神經網路是用於圖片識別的,那麼輸入層就是圖片像素點,一個4px * 4px的黑白圖像需要用到16個神經元來表示輸入,如果是RGB圖像則需要48個神經元表示輸入。映射到李耳的神經系統,我們可以認為是眼角膜和視網膜等器官把圖片轉換成了48個電信號(真實的神經系統映射成了啥也是個迷)。

隱藏層: 隱藏層可以包含很多層,圖片上只畫了一層來代替。在全連接網路中,輸入層的每個神經元都會和隱藏層第一層的神經元建立連接,隱藏層第一層的神經元會和隱藏層第二層的神經元建立連接,依次類推。具體需要多少個隱藏層,每一個隱藏層又需要多少個神經元,這取決於要解決的問題和個人的喜好。通常連接的強度叫做權值,用w表示,加一個下表代表連接兩端的神經元的位置; 隱藏層的神經元用a代替,加一個下表代表第幾個神經元。映射到李耳的神經系統,我們可以認為電信號流過了V1區、V2區...一直到V8區(個人杜撰), V8區已經可以識別出這幅圖片上的內容。

輸出層: 將識別出的信息映射到輸出字典中。比如手寫數字對應的數字字典的第幾個。映射到李耳的神經系統,就是進入的混合層,輸出了"感覺"到的東西,這種感覺是光、聲等相通的。

學習: 學習是一個過程,向我們定義的神經網路中輸入大量的數據,每次輸出的結果和真實結果進行對比後調整神經元之間連接的權值。通過不斷的輸入數據->對比->調整權值來使得我們的神經網路對於絕大多數的輸入可以給出正確的輸出,那我們就成功了。具體可靠的權值調整方式的理論依據會在後面的文章中給出。當然我們也可以通過蠻力法,對權值進行隨機生成,只要我們的模型定義的合理(實在不知道定義啥模型合理,我們就懟儘可能多層,每層儘可能多神經元,只要機器能扛得住),隨機幾百億年後肯定會隨機出一組牛逼的權值,可以使得我們的網路很好的工作。映射到李耳的神經系統,就是剛出生到14歲之間李耳大腦皮層的神經元一直在建立連接和鏈接重構,一直到變成一個牛逼的思想家。

目前的"人工智慧"系統為啥總讓人覺得獃氣十足。

人類對自己的大腦的了解還很少, 大腦皮層更細化的工作原理處於"迷"的狀態。人腦是如何表示"知識"的?人腦是如何有"下意識"的? 人腦是如何"學習"的?這些問題都還沒有解決, 因此現在沒有辦法模仿人腦來做"仿生智能"。

目前也沒有哪個大牛能脫離人腦為智能提供理論依據,因此人類也沒有做到"人造智能"。

一個沒有"智能"的系統,只是統計學的堆疊,沒有靈魂,因此讓人感覺獃氣十足。

人工智慧很遙遠,機器學習很豐滿。

先上圖給大家順一下人工智慧、機器學習、深度學習的概念

人工智慧概念的提出是想要造一台有"智能"的機器,正像前面提到的,目前"智能"並沒有理論依據來支撐,因此這簡直就是天方夜譚。

很多人在批評現在的人工智慧發展方向,認為目前的人工智慧只是統計學懟出來的,和人腦的工作原理感覺上是不太相關的,真的有這麼悲觀嗎?

人腦是進化論的產物,進化論的思維是大環境下的事物總在向好的方向發展,但並不一定是最好的。人腦沒有海豚依靠回聲來定位的功能,人腦也沒有飛蛾依靠光的角度計算飛行方向的功能。因此機器如果有人腦的智能是很好的,但是擁有機器獨有的加強版智能那是更好的。目前用統計學推進的機器學習可以找到海量數據之間的"規律"、"聯繫", 理性的為我們進行決策, 在很多領域(螞蟻金服篩選未來可能成為老賴的花唄用戶,百度愛奇藝預測未來可能會火的節目等)成績優異。期待未來大神們可以在此基礎上為其富予更多的技能。

預告

下一篇文章會帶大家體驗一下數學之美,用數學的方式來解釋這個世界。


推薦閱讀:

Why are you here?
LeCun親授的深度學習入門課:從飛行器的發明到卷積神經網路
一位00後由國內外教育經歷所引發的思考
反欺詐行業首份《無監督機器學習引擎》白皮書發布 | 詳解網路欺詐原理
國內AI陷入自嗨,谷歌發現第二太陽!人工智慧找到外星人已不遠?

TAG:人工智慧 | 機器學習 | 神經網路 |