哪個機器學習演算法能在百年後繼續被使用?-你猜?

看到這個標題,你想到什麼?隨機森林, SVM, K-means, KNN,還是深度學習及其變體?

我認為是回歸(Regression)。

一些人可能要笑了,你怎麼能預測未來?預測100年後的事情太瘋狂了!

是什麼讓我認為回歸將在2118年繼續使用呢?

答案是林迪效應。是的,我用的啟發式預測是林迪效應。

什麼是林迪效應?

維基百科是這樣定義的:

「一些不易被破壞的事物,比如技術或想法,未來的預期壽命與當前的年齡成正比,所以,如果當前壽命越長,那就意味著預期壽命也會很長。」

我最喜歡的一名作家,納西姆·塔勒布在他的著名作品《反脆弱性:從無序中獲得的東西(Antifragile: Things that gain from disorder)》中也定義了林迪效應。

「如果一本書已經印了四十年,我希望它能再印四十年,這後四十年就是預期壽命。值得一提的是,現實壽命增加,預期壽命也會增加。簡單地說,這是一個規則,告訴你為什麼長期存在的事物,不會像人一樣『老化』,而是走向相反方向——成熟和固化。每一年,如果它沒有滅絕,它的預期壽命將會增加一年。對一些不會自然消亡的物品來說,物品的預期壽命與生命成正比!」

為什麼回歸會存活那麼久呢?

因為,它已經存活很久了。回歸(最小二乘法)作為一個概念,最早在19世紀,由卡爾·弗里德里希·高斯和阿德里安·瑪麗·勒讓德提出。他們用回歸確定行星和其他天體繞太陽的軌道路徑。

「回歸」這個詞由弗朗西斯·高爾頓創造,原本是用來形容身材較高的父親往往有相對較矮的兒子,而身材較矮的父親往往有相對較高的兒子!這種趨勢叫回歸。

現在,回歸已經存在200多年了,因此,根據林迪效應,它還將持續200年。因此,我認為回歸會在2118年繼續使用還是一種保守說法。

回歸長壽背後的秘訣是什麼?

舉例來說,2016年Kdnuggets的調查報告如下:

事實上,在Kdnuggets 2011年進行的另一項調查中,回歸的生命已經到頭了。但在林迪效應的影響下,回歸在排行榜冠軍位置盤踞了五年之久!

(更新:在寫這篇文章時,我不知道還有2017年的調查。在該調查中,回歸的使用程度超過上圖所示的67%,根據林迪效應,說明它的預期壽命也會相應地延長)。

回歸仍然是人們廣泛使用的機器學習演算法。人們鍾愛它有三個原因:

  • 簡單
  • 高度可解釋
  • 很管用

各個領域的人都在使用回歸,因為它能很好地為人們工作。人們因此獲得了可觀的投資回報。例如,在市場營銷中,市場混合模型背後的驅動力是回歸。其他領域也是如此。如果回歸在交付結果時沒有用處,就會逐漸被淘汰。現在它仍然被業界和學術界廣泛使用,就是因為「管用」。

那麼神經網路及其變體呢?會在2118年繼續使用嗎?

到目前為止,林迪效應對神經網路的預測不是很好。神經網路曾面臨人工智慧的嚴冬期。這種中斷對於技術的壽命來說不是一個好兆頭。

但從積極的方面看,過去十年,人工智慧的進步日新月異,前景一片光明。 而我作為一名終身學習者,將繼續為最新的AI突破而著迷。因此,樂觀估計是,我們會看到神經網路及其變體在未來10-20年存活下去,希望埃隆·馬斯克所說的「奇點」恐懼不會導致另一個人工智慧的嚴冬。

是什麼減弱了機器學習演算法的林迪效應?

過度使用。

是的,由於機器學習演算法的錯誤應用和過度使用,林迪效應將被減弱。我見過人們是怎麼使用機器學習演算法的,一些簡單的基礎方法都會起作用。

即使數據科學領域,目前最流行的工作也改變不了這種狀況。機器學習演算法成了數據科學家手中的鎚子,哪裡有問題,就去哪裡修修補補,沒有實質的進展。錯誤的應用或過度使用,導致人們逐漸失去對價值的幻想。這將是一個由自我造成的「AI嚴冬」。

但目前看來,回歸將是笑到最後的贏家,甚至到2118年。

作者Venkat Raman,是一名數據科學家和統計學家。

來源:Towards Data Science

作者:Venkat Raman

智能觀 編譯

—完—

親愛的朋友:

聚焦前沿思想,是智能觀的一大特點。

我們都知道,在AI領域的應用上,國內走得比較快;但在研究和思想方面的前瞻性上,國內尚落後於歐美。

智能觀希望通過發現和分享國內外的前沿思想,能予你以啟思。

祝安!

智能觀 一米

2018-2-9 於北京中關村

想知道AI加教育領域有哪些最新研究成果?

想要AI領域更多的乾貨?

想了解更多專家的「智能觀」?

請在對話界面點擊「找找看」,去獲取你想要的內容吧。

聲明:

編譯文章旨在幫助讀者了解行業新思想、新觀點及新動態,為原作者觀點,不代表智能觀觀點。


推薦閱讀:

利用Python實現卷積神經網路的可視化
一行代碼,Pandas秒變分散式,快速處理TB級數據
數據科學導論:前言

TAG:機器學習 | 演算法 | 數據科學 |