神經進化是深度學習的未來
摘要: 本文主要講了神經進化是深度學習的未來,以及如何用進化計算方法(EC)優化深度學習(DL)。
過去幾年時間裡,我們有一個完整的團隊致力於人工智慧研究和實驗。該團隊專註於開發新的進化計算方法(EC),包括設計人工神經網路架構、構建商業應用程序,以及使用由自然進化激發的方法來解決具有挑戰性的計算問題。這一領域的發展勢頭非常強勁。我們相信進化計算很可能是人工智慧技術的下一個重大課題。
EC與Deep Learning(DL)一樣都是幾十年前引入的,EC也能夠從可用的計算和大數據中得到提升。然而,它解決了一個截然不同的需求:我們都知道DL側重於建模我們已知的知識,而EC則專註於創建新的知識。從這個意義上講,它是DL的下個步驟:DL能夠在熟悉的類別中識別對象和語音,而EC使我們能夠發現全新的對象和行為-最大化特定目標的對象和行為。因此,EC使許多新的應用成為可能:為機器人和虛擬代理設計更有效的行為,創造更有效和更廉價的衛生干預措施,促進農業機械化發展和生物過程。
前不久,我們發布了5篇論文來報告在這一領域上取得了顯著的進展,報告主要集中在三個方面:(1)DL架構在三個標準機器學習基準測試中已達到了最新技術水平。(2)開發技術用於提高實際應用發展的性能和可靠性。(3)在非常困難的計算問題上證明了進化問題的解決。
本文將重點介紹裡面的第一個領域,即用EC優化DL架構。
Sentient揭示了神經進化的突破性研究
深度學習的大部分取決於網路的規模和複雜性。隨著神經進化,DL體系結構(即網路拓撲、模塊和超參數)可以在人類能力之外進行優化。我們將在本文中介紹三個示例:Omni Draw、Celeb Match和Music Maker(語言建模)。在這三個例子中,Sentient使用神經進化成功地超越了最先進的DL基準。
音樂製作(語言建模)
在語言建模領域,系統被訓練用來預測「語言庫」中的下一個單詞,例如《華爾街日報》幾年內的大量文本集合,在網路做出預測結果後,這個輸入還可以被循環輸入,從而網路可以生成一個完整的單詞序列。有趣的是,同樣的技術同樣適用於音樂序列,以下為一個演示。用戶輸入一些初始音符,然後系統根據該起始點即興創作一首完整的旋律。通過神經元進化,Sentient優化了門控周期性(長期短期記憶或LSTM)節點(即網路的「記憶」結構)的設計,使模型在預測下一個音符時更加準確。
在語言建模領域(在一個叫Penn Tree Bank的語言語料庫中預測下一個詞),基準是由困惑點定義的,用來度量概率模型如何預測真實樣本。當然,數字越低越好,因為我們希望模型在預測下一個單詞時「困惑」越少越好。在這種情況下,感知器以10.8的困惑點擊敗了標準的LSTM結構。值得注意的是,在過去25年內,儘管人類設計了一些LSTM變體,LSTM的性能仍然沒有得到改善。事實上,我們的神經進化實驗表明,LSTM可以通過增加複雜性,即記憶細胞和更多的非線性、平行的途徑來顯著改善性能。
為什麼這個突破很重要?語言是人類強大而複雜的智能構造。語言建模,即預測文本中的下一個單詞,是衡量機器學習方法如何學習語言結構的基準。因此,它是構建自然語言處理系統的代理,包括語音和語言介面、機器翻譯,甚至包括DNA序列和心率診斷等醫學數據。而在語言建模基準測試中我們可以做得更好,可以使用相同的技術建立更好的語言處理系統。
Omni Draw
Omniglot是一種可以識別50種不同字母字元的手寫字元識別基準,包括像西里爾語(書面俄語)、日語和希伯來語等真實語言,以及諸如Tengwar(《指環王》中的書面語言)等人工語音。
上圖示例展示了多任務學習,模型可以同時學習所有語言,並利用不同語言中字元之間的關係。例如,用戶輸入圖像,系統根據匹配輸出不同語言的含義,「這將是拉丁語中的X,日語中的Y以及Tengwar中的Z等等」——利用日本、Tengwar和拉丁語之間的關係找出哪些角色是最好的匹配。這與單一任務學習環境不同,單一環境下模型只對一種語言進行訓練,並且不能在語言數據集上建立相同的連接。
雖然Omniglot是一個數據集的例子,但每個語言的數據相對較少。例如它可能只有幾個希臘字母,但很多都是日語。它能夠利用語言之間關係的知識來尋找解決方案。為什麼這個很重要?對於許多實際應用程序來說,標記數據的獲取是非常昂貴或危險的(例如醫療應用程序、農業和機器人救援),因此可以利用與相似或相關數據集的關係自動設計模型,在某種程度上可以替代丟失的數據集並提高研究能力。這也是神經進化能力的一個很好的證明:語言之間可以有很多的聯繫方式,並且進化發現了將他們的學習結合在一起的最佳方式。
Celeb Match
Celeb Match的demo同樣適用於多任務學習,但它使用的是大規模數據集。該demo是基於CelebA數據集,它由約20萬張名人圖像組成,每張圖片的標籤都由40個二進位標記屬性,如「男性與女性」、「有無鬍子」等等。每個屬性都會產生一個「分類任務」,它會引導系統檢測和識別每個屬性。作為趣味附加組件,我們創建了一個demo來完成這項任務:用戶可以為每個屬性設置所需的程度,並且系統會根據進化的多任務學習網路來確定最接近的名人。例如,如果當前的圖片為布拉德·皮特的形象,用戶可以增加「灰色頭髮」屬性,已發現哪個名人與他相似但是頭髮不同。
在CelebA多任務人臉分類領域,Sentient使用了演化計算來優化這些檢測屬性的網路,成功將總體三個模型的誤差從8%降到了7.94%。
這一技術使得人工智慧在預測人類、地點和物質世界各種屬性的能力上提升了一大步。與基於抽象,學習功能找到相似性的訓練網路不同,它使相似的語義和可解釋性也成為可能。
本文由阿里云云棲社區組織翻譯。
文章原標題《Evolution is the New Deep Learning | Sentient Technologies》
作者:Risto Miikkulainen
譯者:奧特曼,審校:袁虎。
文章為簡譯,更為詳細的內容,請查看原文
更多技術乾貨敬請關注云棲社區知乎機構號:阿里云云棲社區 - 知乎
推薦閱讀:
※戰狼:業務高速增長,如何保證系統高可用
※《架構即未來》(壹)
※scrapy進階,組合多請求抓取Item利器ItemCollector詳解!
※ApsaraDB For SQL Server Multi-AZ 高可用版資料庫使用介紹
TAG:深度學習DeepLearning | 架構 | 人工智慧 |