人工智慧對未來的預測越來越准了

大規模的數據收集和處理能力的飛躍,為人工智慧的重大進步奠定了基礎。然而越來越多的證據表明,人工智慧領域已經準備好進入一個全新的高度,人工智慧不僅能夠想像現實世界,而且能夠開始準確地判斷什麼是真實的、重要的,什麼是不真實的、不重要的——從而預測接下來會發生什麼。

谷歌公司研究科學家Carl Vondrick近日在舊金山Re-Work深度學習峰會發表演講時說:「計算機非常擅長記憶,問題是教他們如何忘記。」

Vondrick的研究專註於當今世界網路最棘手的挑戰之一:如何利用大量的、無處不在的、無標籤視頻的資料庫。被一個可愛的嬰兒或有趣的貓咪視頻逗笑是一回事,要從視頻中獲得信息是另一回事。

從視頻中學習

谷歌研究小組認為,最好的方法是:使用數百萬個無標籤的視頻時間來訓練深度學習神經網路(DNN),以更好地了解世界。利用大量可用的素材,採用了人工智慧技術的網路不僅可以準確描述它看到了什麼,而且還可以預測接下來將會發生什麼。

在這次峰會,Vondrick展示了人們相互交流的視頻,然後網路分析出基本正確的結果。擁抱、握手或擊掌,往往是基於視頻捕捉到的人際交往的行為。

深度學習研究是重要的,因為人類對機器越多依賴,越要機器有能力辨別所觀察的人類行為。如果一個人靠近門把手,這時候如果機器人決定關門的話,就是非常不合適的。

將聲音與圖像關聯

有趣的是,谷歌研究人員一直在擴展深度學習模式,把聲音也包含在內。峰會與會者聽到一段唱著「生日快樂」的音樂,而當視頻圖像顯示出來,網路正確地預測了該段視頻中會有蠟燭的形象。Vondrick解讀道,深度學習系統在預測行動方面進展順利,精確度達74%,比人類的速度提高了約10個百分點。

Vondrick坦言:「這項任務仍然非常困難,我們並不總能得到正確的結果。」

Vondrick的研究是基於一種被稱為對抗式學習(adversarial

learning)的方法,這種方法實際上是讓兩種網路彼此競爭。一個網路產生真實的圖像,另一個網路分析這些圖像,並確定這些圖像是真的還是假的。「谷歌大腦」研究人員Ian

Goodfellow最近也採用了這種技術,他已經成為「生成式對抗式網路」(GAN,Generative Adversarial

Networks)領域的權威。

在Goodfellow的工作中,GAN創造出真實世界的照片和聲音。Goodfellow說:「GAN是基於博弈論的生成模型,開啟了廣泛的工程任務的大門。」

這些任務包括各種深度學習模式,在這些模式下,機器可以被要求把一匹棕色的馬變成斑馬。在這次峰會的一段視頻中,一匹馬在動物園中躍躍欲試,斑馬的條紋完美地呈現出來,並且由於計算機從非洲大草原拍攝的圖像中找到了斑馬紋,所以在背景中還有一些褐色的草。

理解書面文字的上下文

機器要理解書面文字的上下文,也許更重要的是深度學習方面的進步,也就是訓練計算模型以理解人的情境。在艾倫人工智慧研究所(Allen Institute for AI),研究人員正在從在線資料庫中讀取大量未標記的文本數據,來訓練大規模的語言模型。

這裡使用的關鍵方法結合了來自語言模型或ELMo表示的嵌入。艾倫研究所的研究科學家Matthew Peters說:「ELMo的表述是上下文的,依賴於所使用的整個句子。」

在這次峰會上,Peters展示了這種技術如何使網路能夠正確解讀像「play」這種簡單單詞背後的意圖,這個單詞可以有多種含義,取決於它在句子中的用法。「three-point

play」可能意味著與「representatives who play to the party

base」完全不同的含義。通過訓練完整的句子而不是有限的單詞定義,計算機正在學習如何做到這一點。

人工智慧移動化

人工智慧也正在擴展到移動設備。Facebook人工智慧攝像頭團隊開發了一項新技術Mask

R-CNN2Go,可以檢測身體姿勢,並且可以準確地將圖像從背景中分離出來。這不是一個容易解決的問題,因為實時檢測身體動作是一個混亂的過程。衣服、運動和附近的其他人或物體的存在都會干擾。人工智慧網路必須能夠最終排除掉圖像的其他部分,以便準確地檢測和跟蹤人體姿勢。換句話說,它必須學會「忘記」。

Facebook公司研究工程師Andrew

Tulloch表示,Facebook人工智慧實驗室(FAIR)最近發布了基於開源代碼的Mask

R-CNN平台。在Facebook龐大的移動用戶社區中使用這個應用突顯了其未來潛力。「這是一個巨大的機會,」Tulloch表示。

深度學習到底要走多遠?本月早些時候在拉斯維加斯舉行的CES消費電子展上,參觀者看到從人工智慧控制的貓咪寵物玩具,到以人工智慧為動力的站立式辦公桌,連流行文化偶像賈斯汀?汀布萊克也加入了這場派對,最近發布了一個融入人工智慧主題的視頻。

英偉達公司人工智慧基礎設施副總裁Clement Farabet說:「深度學習現在幾乎是一種商品了。這意味著,我們只能看到人工智慧技術如何改變我們日常生活這一個開始。」


推薦閱讀:

iOS: 使用 Turi Create 自定義 Core ML Model
智能硬體:AI給智能硬體帶來了第二春還是第二個大泡沫?| 2018展望

TAG:人工智慧 | 人工智慧AI醬 |