關於AI的胡說八道

01-24

這段時間AlphaGo的新聞在到處刷屏，好多人在說，計算機要戰勝人類了。個人覺得這種提法有點莫名其妙，馬跑贏人，你不說馬戰勝人類，火車跑贏馬，你不說火車戰勝人類。好腦筋不如硬筆頭，你不說筆頭戰勝人類。用Python計算20位的乘法可以秒算，你不說Python戰勝人類。怎麼弄個對圍棋的模式匹配出來，你就覺得這玩意兒就戰勝人類了呢？

大抵上，大部分人都沒有「聖人」那種「以人之有以為己之有」的覺悟，沒有「以天下之至柔馳騁天下之至堅」的胸懷。什麼都要認為是自己的，用個籬笆圍起來，標上「私人財產」才會滿足。所以，「五音令人目盲，難得之貨令人行妨」實在是把這些人描繪得栩栩如生。

那麼最近AI的發展，到底踩了這些人的什麼「私人區域」呢？估計是「直覺」。個位相加進位到十位，十位再相加到百位，這種動作是有邏輯的，有「理智」的，有「道理」的，這種東西你計算機算得快，咱不敢跟你爭，但你計算機有「直覺」嗎？你可以看到一隻貓就可以得到「貓」這個詞嗎？你可以冥冥中知道面對特定的棋局的時候，「感受」到下一步應該是「飛」還是「刺」嗎？這說起來是好像是人類最後的自尊心似的。

但這個其實也不算什麼，因為似乎現在熱炒的神經網路就是解決類似問題的其中一種方法。

關於神經網路，我原來問過不少人，好多都說得不名不白的，我這裡做一個歸納，懂的跳過這一段吧。

所謂神經網路，是一個數學概念，和我們現實中的網路沒有什麼關係。它的概念來自對動物神經元網路的研究。據說，Once up a time，有一群邪惡的科學家，躲在一個戒備深嚴的黑暗基地中，把一些可愛的小花貓綁起來，在腦袋後面開了一個腦洞，然後讓它看不同的圖片，研究它大腦皮層神經元的電極變化。

最後他們有這麼一個結論：視神經傳遞進來不同的信息，進入邊緣的神經元，每個神經元會受到一個簡單的刺激，然後把這個刺激傳遞給下一層的神經元，這樣會在整個網路上形成不同的電平分布和聚集。這被認為是一種「抽象」的過程——人或者動物在得到大量的信息後，會通過神經網路抽象為簡單的「概念」（比如「貓」，「煞筆」之類的）。

後來又有一些瘋狂科學家，基於這個概念發明了一種所謂的人工的神經網路（ANN）。這個東西本質是一種類似的數學結構，我們把輸入的信息，首先經過簡化，變成一個向量，然後把這個向量輸入到一個這樣的網路中，讓它產生波動，讓它形成「抽象」，比如，一個40歲，有潔癖，長頭髮，鼻樑高，反骨突，耳垂長的猥瑣男人挑這款咖啡貓馬桶坐墊的可能性有多大呢？我們可以把這個作為一個向量A[40, 2（潔癖程度），30（頭髮長度）, 12（鼻樑高度）, 3(反骨高度）, 2(耳垂長度），3（猥瑣程度）, 1（男）]輸入到神經網路中，神經網路的每個節點接受其中一個參數，如圖所示：

每個輸入要先進行標準化（比如每個參數都變成0-1之間的值，避免有一個參數特別重要，類似高考的標準分），然後進行綜合，比如v=a1w1+a2w2+a3w3+...，變成一個單一的值，輸入到下一層的神經元，每個神經元都做一個簡單的運算（這個運算稱為刺激函數：y=f(v,si)），基於v和一個控制參數產生下一個輸入。這樣一層層計算下去，到最後一層，就只有少數幾個輸出，比如「買咖啡貓馬桶墊」和「不買咖啡貓馬桶墊」。這樣，我們就得到一個模擬的「直覺思考」模型了。

這個東西類似巫術——找兩個算籌，問問生辰八字，擺個玄而又玄的形狀，然後扔上去，說自己奪天地之造化，然後預測你明年會不會發財。當然，如果現代巫術還是這種水平，那人類就太沒有長進了。所以，概率論這種現代巫術也搬上來了。上面那個「直覺模型」，真正決定輸出的，其實是網路本身的結構，演算法以及所有的Wi和Si，得到最後的「抽象」也不準，但如果我們已經有十萬個先驗數據呢？也就是我們有一萬個買還是不買這種坐墊圈的實際數據對這個模型進行「訓練」，讓它「閱人無數」，每次如果算錯了(Loss），就給網路一個反饋（比如一種常見的演算法叫梯度下降法），調整這些Wi和Si的值，如果這個事情確實是具有規律的（特徵），這個訓練就有可能成功，比如，我們最後對於這十萬個數據，正確判斷結果可以達到80%，這樣這個模型就具有參考價值了。下次我們看到上面提到的猥瑣老男人，我們就告訴你，這個傢伙有90%的可能買咖啡貓馬桶墊。

這個功能非常實用，只要你有數據，你就是個現代巫師。AlphaGo只要有足夠的棋譜去喂，以及足夠的計算資源，你的「直覺」遠遠不如。但是不是人類因此就沒有存在價值呢？你這樣想，只能說是窮碧慣了，沒有過過好日子。計算機吃電，你吃飯，你們有很多衝突嗎？要不要每件事都來「比一比」啊？人和計算機是無有入無間，你真的有必要什麼都要拿在自己手上嗎？你買輛汽車回來不想著怎麼快點到單位，想著有什麼辦法「戰勝」汽車？腦子有水啊？

當然，拉黃包車的還是要緊張的。比如我們這種做CPU的。上面神經網路那類的演算法，是個讓人又喜又憂的現實。喜的是，計算機工業很長時間都聚焦在IO上，對「計算」的要求有比較長一段時間內不怎麼引起人們的注意了。所以，賣「計算」的人有出頭之日了，錢又開始投給「計算」了。但另一方面，CPU這種「理智計算」卻不是重點，AI的運算大部分時候，是非理智計算。它的要求可能是：

向量化的：比如前面算v=a1w1+a2w2+a3w3+...，cpu要先算a1*w1，然後算a2*w2，再算a1w1+a2w2... 但如果你GPU算，可能一條指令就把整條公式給它算了。

低精度的：我們最後只是要一個「抽象」，根本沒有必要讓每個參數都是什麼64位的，比如，只支持8位的計算就可以了。

重複性的（模式化的）：每個神經元都是單一的簡單計算，並不需要CPU這麼複雜的指令集和特定的流水線優化。

非精確的：上面的整個計算過程，也不需要精確的計算設計，你要算100*100，它就不需要等於10000，等於9998之類的就差不多了，這也為「計算」的優化提供了機會

光向量化這一點就把CPU踢出了主演的列表了，GPU現在是主角，但如果考慮到精度和精確這些要素，它的地位能否保持，見仁見智。新的計算單元遲早是要進入舞台的，叫不叫TPU就難說了。

在這個遊戲中，誰能贏呢？在水剛剛開始攪動的時候，誰能說這個水最終會流到哪裡？但水是擺在那裡的，這一點倒是肯定的。把錢投在這上面，是有基礎的理由的。

現在有三個注目的中心：演算法方（研究演算法的人），數據方（擁有訓練數據的人），計算方（提供計算基礎設施的人）。錢最終流到哪裡（注意，不是流向上面說的三個「方」，而是三類「方」的無數個「方」中）？這是上帝都無法知道的事情——上帝也缺乏訓練數據：（。

但我們知道的是，長江後浪推前浪，前浪死在沙灘上。所以，這個時世，抱哪個大腿，都是死得快。我看到，某些做編譯器的，想著基於編譯器做自己的生態，某些做處理器的，想著做自己專用的處理器，做GPU的，想著做自己的OS和驅動。想想這些，估計會活得很艱難。以身為天下，方可以托天下。這個階段，就是要成為所有方案的助力，善利萬物而不爭，你成為別人的依託，最後別人就離不開你，你才會活下去。盈利點都十劃沒有一撇就想著圍一個園子出來自己玩的，遲早還是會玩死在自己的園子中的。

其實，你讓我說，AI本質是巫術。現在搞這個行業的都太Navie，老想著弄什麼圖像識別啦，語音識別啦，自動駕駛，下圍棋啦。都是書生意氣。弄這些個東西就應該回到真正的巫術上來。你說你把什麼馬某雲啦，王某林啦之類的生辰八字，掌紋面相，還有什麼金木水火土，五行方位的，搞個8層的神經網路給它算一算（不要問我為什麼是八，據說是小崔說的），以後丈母娘選女婿的時候，把這些東西往裡一輸，嘩嘩嘩的數據就出來了。到時你要賣手機可以賣手機，要賣雲服務可以賣雲服務。什麼不比你動不動撞死人背鍋的自動駕駛要強？

就算你不信這一套，你做生意，做HR，閱人無數，每個人偷偷給他照個照片，存在你手機的資料庫中，標記上：此人可信，此人易騙，此人偏激，諸如此類的。讓你的手機學習一通。以後再遇到新的合作夥伴，照個照片就讓他無所遁形。這不是甚好？

所以，你說搞什麼「看電腦」，「聽電腦」的啊，我們就應該搞什麼「周易電腦」，「黃帝陰符先天八卦電腦」，「聖母臨凡星座電腦」。這才有商機的嘛……