哪個機器學習演算法能在百年後繼續被使用？-你猜？

04-05

看到這個標題，你想到什麼？隨機森林, SVM, K-means, KNN，還是深度學習及其變體?

我認為是回歸（Regression）。

一些人可能要笑了，你怎麼能預測未來？預測100年後的事情太瘋狂了！

是什麼讓我認為回歸將在2118年繼續使用呢？

答案是林迪效應。是的，我用的啟發式預測是林迪效應。

什麼是林迪效應？

維基百科是這樣定義的：

「一些不易被破壞的事物，比如技術或想法，未來的預期壽命與當前的年齡成正比，所以，如果當前壽命越長，那就意味著預期壽命也會很長。」

我最喜歡的一名作家，納西姆·塔勒布在他的著名作品《反脆弱性:從無序中獲得的東西（Antifragile: Things that gain from disorder）》中也定義了林迪效應。

「如果一本書已經印了四十年，我希望它能再印四十年，這後四十年就是預期壽命。值得一提的是，現實壽命增加，預期壽命也會增加。簡單地說，這是一個規則，告訴你為什麼長期存在的事物，不會像人一樣『老化』，而是走向相反方向——成熟和固化。每一年，如果它沒有滅絕，它的預期壽命將會增加一年。對一些不會自然消亡的物品來說，物品的預期壽命與生命成正比!」

那為什麼回歸會存活那麼久呢？

因為，它已經存活很久了。回歸(最小二乘法)作為一個概念，最早在19世紀，由卡爾·弗里德里希·高斯和阿德里安·瑪麗·勒讓德提出。他們用回歸確定行星和其他天體繞太陽的軌道路徑。

「回歸」這個詞由弗朗西斯·高爾頓創造，原本是用來形容身材較高的父親往往有相對較矮的兒子，而身材較矮的父親往往有相對較高的兒子!這種趨勢叫回歸。

現在，回歸已經存在200多年了，因此，根據林迪效應，它還將持續200年。因此，我認為回歸會在2118年繼續使用還是一種保守說法。

回歸長壽背後的秘訣是什麼？

舉例來說，2016年Kdnuggets的調查報告如下：

事實上，在Kdnuggets 2011年進行的另一項調查中，回歸的生命已經到頭了。但在林迪效應的影響下，回歸在排行榜冠軍位置盤踞了五年之久！

(更新:在寫這篇文章時，我不知道還有2017年的調查。在該調查中，回歸的使用程度超過上圖所示的67％，根據林迪效應，說明它的預期壽命也會相應地延長)。

回歸仍然是人們廣泛使用的機器學習演算法。人們鍾愛它有三個原因：

簡單
高度可解釋
很管用

各個領域的人都在使用回歸，因為它能很好地為人們工作。人們因此獲得了可觀的投資回報。例如，在市場營銷中，市場混合模型背後的驅動力是回歸。其他領域也是如此。如果回歸在交付結果時沒有用處，就會逐漸被淘汰。現在它仍然被業界和學術界廣泛使用，就是因為「管用」。

那麼神經網路及其變體呢？會在2118年繼續使用嗎？

到目前為止，林迪效應對神經網路的預測不是很好。神經網路曾面臨人工智慧的嚴冬期。這種中斷對於技術的壽命來說不是一個好兆頭。

但從積極的方面看，過去十年，人工智慧的進步日新月異，前景一片光明。而我作為一名終身學習者，將繼續為最新的AI突破而著迷。因此，樂觀估計是，我們會看到神經網路及其變體在未來10-20年存活下去，希望埃隆·馬斯克所說的「奇點」恐懼不會導致另一個人工智慧的嚴冬。

是什麼減弱了機器學習演算法的林迪效應？

過度使用。

是的，由於機器學習演算法的錯誤應用和過度使用，林迪效應將被減弱。我見過人們是怎麼使用機器學習演算法的，一些簡單的基礎方法都會起作用。

即使數據科學領域，目前最流行的工作也改變不了這種狀況。機器學習演算法成了數據科學家手中的鎚子，哪裡有問題，就去哪裡修修補補，沒有實質的進展。錯誤的應用或過度使用，導致人們逐漸失去對價值的幻想。這將是一個由自我造成的「AI嚴冬」。

但目前看來，回歸將是笑到最後的贏家，甚至到2118年。

作者Venkat Raman，是一名數據科學家和統計學家。

來源：Towards Data Science
作者：Venkat Raman
智能觀編譯

—完—

親愛的朋友：
聚焦前沿思想，是智能觀的一大特點。
我們都知道，在AI領域的應用上，國內走得比較快；但在研究和思想方面的前瞻性上，國內尚落後於歐美。
智能觀希望通過發現和分享國內外的前沿思想，能予你以啟思。
祝安！
智能觀一米
2018-2-9 於北京中關村

想知道AI加教育領域有哪些最新研究成果？
想要AI領域更多的乾貨？
想了解更多專家的「智能觀」？
請在對話界面點擊「找找看」，去獲取你想要的內容吧。

聲明：
編譯文章旨在幫助讀者了解行業新思想、新觀點及新動態，為原作者觀點，不代表智能觀觀點。