「現有人工智慧都是二流的」

李杉 編譯自 Wired

量子位 出品 | 公眾號 QbitAI

目前在用的所有人工智慧都是二流的,就像一個愚蠢的蜥蜴大腦,對世界的複雜性一無所知。所以,它才需要大量的數據。我們想要構建的更像是哺乳動物的大腦。

說出這番話的,是哈利·瓦爾普拉(Harri Valpola),44歲,人工智慧創業公司The Curious AI Company創始人。

哈利

對目前人工智慧進步速度充滿失望的哈利,有著似乎遙不可及的目標:他做夢都想創造一個思維互聯網,一個由相互連接的人工智慧組成的互聯網。

「從我們的角度來看,它就像一個巨型大腦。」他說。

他創立的Curious AI位於芬蘭赫爾辛基,有20名員工,剛剛獲得了367萬美元融資。這樣的數字和眾多科技公司相比簡直不足掛齒,但考慮到這家公司什麼實際產品都沒有,完全著眼於研究,可以算是一筆不小的投資。

給一家不接地氣的研究所,投入幾百萬美元,背後有什麼道理可講?

公司投資者Balderton Capitald的合伙人Daniel Waterhouse說,他們寄希望於研究的過程中可能出現一些產品和商業機會,而且,哈利也已經組建了世界級的團隊。

在這種語境下,「世界級」意味著具有學術天賦的人才。

哈利自己,就有著無可挑剔的學術背景。他是芬蘭神經網路先驅Tuevo Kohonen的學生,曾在阿爾託大學(Aalto University)研究人工大腦長達20年。

但是,直到2007年離開學術界,將自己的理論應用到現實問題中的「臟數據」時,他才意識到自己的研究中缺少什麼。

未成功的革命

哈利想將20年的理論研究付諸實踐,為它們找到用武之地。

於是,他參與創立了ZenRobotics,一個專門為智能機器人開發「大腦」的創業公司,想要在人工智慧領域掀起一場革命。

ZenRobotics

不過,「掀起革命」只是創業之初的「計劃」,面對種種殘酷的物理現實,實驗室里效果一流的技術難以應對。

他們遇到的第一個問題是數據。

在計算機模擬的環境做研究時,機器人可以「看到」周圍的一切。但放到公司的業務上,就需要讓機器人在混亂而複雜的物理世界中工作,遇到的都是派不上用場的「臟數據」,可見度遠沒有那麼高。

第二個問題,是以往訓練機器人的方式並不可取。

在模擬環境中訓練機器人,總是要運行上百萬次測試來找到有效的方法,但這在現實世界中根本行不通。

就像它們的造物主——人類一樣,現實世界中的機器人行動遲緩,擁有笨重的形體。還沒來得及發展出什麼技能,就被禁錮在了反覆的日常之中。

走出象牙塔的哈利終於認識到:「在現實世界中,交互是一種非常稀缺的資源。我做出不少驚人結果的那些技術,都局限在模擬環境里。」

革命是掀不起來了,ZenRobotics改變方向,為機器人找了一個更簡單的目標:從工業廢料中篩選有用的原材料。

找到新目標的ZenRobotics融資1100萬英鎊,還吸引了一批全世界規模最大的回收公司,但是,哈利還是很失望。

解決數據問題

2015年,哈利揣著原本的夢想離開了ZenRobotics,想再試一次。

於是,就有了Curious AI。

Curious AI的三位聯合創始人,從左到右分別為:CTO Antti Rasmus、CEO Harri Valpola和COO Timo Haanp??,還有一位聯合創始人Mathias Berglund沒有出現在照片中

在這家新公司,哈利和他的同事們解決了在ZenRobotics遇到的很多難題。

首先,是數據上的困難。

哈利的應對方法很簡單:「清洗臟數據的最佳方法,就是讓電腦去做。」在他2015年發表的一篇論文中,描述了一個「階梯網路(ladder network)」,這種神經網路可以通過向結果中注入雜訊的方式,來訓練自己應對複雜的情形,就像老師在測試中故意留下錯誤,藉此讓學生保持警惕一樣。

藉助這個階梯網路,電腦即使沒有大量預先標記的樣例,依然可以進行學習。業內人士將這類技術稱作「半監督式學習」。

在用業內常用的基準數據集MNIST測試時,哈利等人的系統只使用了100個經過標記的訓練樣例,卻準確識別了幾乎99%的圖像。頂尖計算機科學家稱讚其「令人印象深刻,具備頂尖水準」。

這篇論文的題目是Semi-Supervised Learning with Ladder Networks,感興趣的同學可以去arXiv閱讀:arxiv.org/abs/1507.0267

哈利繼續開發這項技術,想把它用到更多的數據集上。在今年的NIPS會議上,他會展示這個階梯網路的「堂弟」,名叫「刻薄的老師」(Mean Teacher)。

這一次,他們改進了原來的系統,用來自谷歌街景的房屋編號圖片進行測試,結果顯示,效果超過了之前的程序,而使用的訓練樣例甚至更少。

「我在論文中看到的結果很好,半監督式學習仍在繼續改進,還打破了另一項紀錄。」蒙特利爾大學計算機科學教授Yoshua Bengio說,他是深度學習領域的領軍人物之一。

「刻薄的老師」論文標題很長,它叫做:Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results,感興趣的同學還是可以去arXiv:arxiv.org/abs/1703.0178

不再依賴試錯

哈利在ZenRobotics還遇到了另一個問題,那就是人工智慧對試錯法的依賴。

目前最先進的人工智慧系統要找到解決問題的正確方法,需要運行上百萬次測試。

這種模式在視頻遊戲中效果很好,系統可以在裡面嘗試數十億種不同的場景,逐漸了解哪些方式能夠奏效。

但在物理世界裡,就沒這麼簡單了。

哈利說,為了讓機器人順利學會解決現實世界中的問題,人工智慧需要具備根據相對較少的信息進行推理的能力:完成人類所謂的「規劃」任務。

可問題在於,虛擬神經網路並不擅長這種任務。讓一個深度學習系統快速給大熊貓、長頸鹿分類打上標籤,是很容易的。但如果你問:「你會把什麼樣的圖片標記成熊貓?」它就不知所措了。

人類,和不少其他動物,都很擅長這樣的推理。比如說你為了換燈泡,可能會糾結一下拿椅子還是拿梯子,但你一定會為了這個結果,在意識中描繪出整個方案。

但對於現在的人工智慧來說,它們頂多會在看到你站在梯子上、手伸向燈泡的時候,推斷出你要換燈泡。但怎麼換、分幾步,人工智慧沒法轉過頭來做規劃。

「要制定任何智能決策,這一點都至關重要。」

哈利說:「我們已經解決了這個問題。我們可以調用能夠生成自然語言的神經網路。我們的AI可以為了達到一個目標,進行一些活動。」

這項研究還沒有公布,但哈利說也快了。

真正的思維互聯網

Curious AI的研究方向

當然,對哈利來說,解決這兩個問題只是前奏。在真正創造出思維互聯網之前,他不會滿足。

這一次,他的方案仍然來自於對人類思維流程的模仿,尤其是「相關性推理」。

什麼是相關性推理呢?低頭看看你的手。為了理解它的存在,你會把它和其它對象關聯起來,比如說你的另一隻手、身體的其它部位、房間里的物品等等。

而神經網路看待世界的方式截然不同。要理解一隻手,你得給它拍一張照片,將其分解成一個個的像素。然後,神經網路會查看像素,為每一個區域分配一組數字,也就是根據它們和不同物體的相似程度來打分。

這樣的過程,讓它可以認出物體的特徵,但卻不明白哪個特徵屬於哪個物體,也不知道物體之間如何相互關聯。

正因如此,它才需要那麼多數據:它無法推斷關係,因此每次都註定要重新學習新的環境。

哈利說,從本質上來看,神經網路就無法真正了解哪些東西與哪些東西結合在一起構成了一個物體。而沒有這種能力,人工智慧根本掀不起什麼風浪。

很多業內專家都認同這種觀點。

「我見過哈利幾次,我們對人工智慧和機器學習持有相似的觀點。」帝國理工學院認知機器人教授Murray Shanahan說,「我認為他是對的。」

Bengio則補充道:「我自己也啟動了一個有著相似目標的研究項目。從我們在感知上取得的突破發展到更高層次的認知,是未來進步的重要元素。」

問題是,如何進步?

Alphabet旗下人工智慧研究部門DeepMind最近發表了兩篇論文,闡述了如何使用神經網路來應對這種挑戰。

但哈利對此有些不屑。「我做這項工作已經很長時間,大約8年前,我們就開始從事跟他們發表的論文很相似的工作。我們做過嘗試,但沒用。」

哈利說,根本沒用的原因是它仍然基於割裂的信息組成的數字模型。他認為,想要克服物體之間的關係問題,人工智慧就需要具備處理連續數據信號的能力——具有諷刺意味的是,這意味著人工智慧需要變得更加模擬化(analogue)。

「這是人類學習的基礎。」瓦爾普拉說。也是他想打造的「哺乳動物大腦」的關鍵所在:「這種大腦與當前的深度學習具備相同的感知能力,但除此之外,還具有與生俱來的符號處理和模擬推理能力。」他不肯透露具體的方式。「這是機密。」但他從剛踏入學術界就開始研究這個課題。

「第一批原型是10年前做的。我們一直在做這件事情。所以我們正在開發互動更加豐富的神經網路。我認為人們還沒有意識到其中蘊含的意義。但我認為,未來一年,我們會在這個領域實現很有趣的發展。」

未來

思考如何讓人工智慧理解關係,也有助於我們預測它們究竟會變成什麼樣子。

哈利對於人工智慧可能所引發的各種倫理問題一笑了之。相反,他認為人工智慧會把自己視作一個與其他智慧生物相連的複雜關係網路的一部分:

不只是作為思維互聯網組成部分的人工智慧,還包括人類智能。無論是好是壞,它們都將具有社會性。

「我們目前開發的人工智慧將具備一個很好的模型,」瓦爾普拉說,「不僅會做回形針,還能了解人類在思考什麼。有個老掉牙的問題:如何過上好的生活?我認為人工智慧可以理解這個問題。」

「在第一波人工智慧時代,你必須是程序員。到了第二波,你必須是數據科學家。到了第三波——你的品行越端正越好。」

原文地址:wired.co.uk/article/har

歡迎大家關注我們的專欄:量子位 - 知乎專欄

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位 QbitAI

?? ? 追蹤AI技術和產品新動態

推薦閱讀:

全域旅遊時代帶來全域數據,行業自身得有桿秤
谷歌大神帶你十分鐘看懂TensorFlow
守著「偽需求」閉門造車,還談什麼大數據價值變現!
數據科學家、數據分析師、數據挖掘工程師、數據工程師,你分的清楚嗎?
如何整合複雜技術打造數據分析平台?

TAG:人工智能 | 机器学习 | 大数据 |