諾獎評委、工業 4.0 教父沃夫岡解讀AI研究大趨勢
德國是公認的工業強國。在新智元 AI 技術峰會上,德國人工智慧研究中心首席執行官,諾貝爾獎評審委員會成員沃夫岡 · 瓦爾斯特爾進行題為「德國 AI 研究的大趨勢: 團隊型機器人、長期自控和大規模多模態」的主題演講,分享了德國的「工業4.0」經驗,機器人工業應用和人機協作等前沿研究問題。
沃夫岡·瓦爾斯特:大家好!歡迎大家來到這次非常重要的會議,今天主要跟大家講一下我的經歷,我在德國的一些經驗以及在德國進行的AI方面的研究。我講的主題是團隊機器人,這是現在很熱的領域,以及長期自主和大規模、多模態。
第一,我們在德國總是說,AI就是信息技術的一個前沿領域。大家都知道,人工智慧在一方面是計算機的分學科,但是另外一方面,它也是工程方面的分學科。不僅如此,它在認知方面也有很重要的元素,這三者結合起來再結合生物學、語言學、機器學習、心理學等等,有時候甚至是哲學也會被包含進來。因此,這是一個非常多領域的學科。
現在AI是一個重點研究的領域,我們在DFKI已經研究了30年,我們的目標是實現智能控制和在計算機系統上實現智能。當我們把AI和技術結合起來的時候會出現什麼樣的效果?那就是我們的產品會變得更加智能化,沒有遙控,它們也能完成很多的任務。他們能夠自己去規劃自己的路徑和行動,並且去管理資源,他們是自主的,你不需要去給他們指令。在事情發生之前,他們就能夠做出反應,非常具有適應性,適應新的環境。
他們是自解釋性的,這意味著AI系統能夠解釋他們自己的決策制定。當你去詢問他們的時候,他們是自我優化的、自我學習的,有的時候甚至是有自愈功能的,這是我們的目標。所有的這些特徵,當然不是在所有的系統當中都存在,有的時候只會有部分特徵。
工業4.0:第四次工業革命
在德國有一個很大的趨勢,我們稱為工業4.0,第四次工業革命。同樣,它當中也會應用到很多人工智慧的技術。這個概念是在2010年由三位教授所提出的,一家軟體公司我們在2011年發布了第一篇論文,今天在全世界範圍內來描述工業4.0進展的論文已經超過了八萬篇,並且在歐洲的總投資每年都達到了1400億歐元,包括智能工廠等等這樣一些應用。
德國人工智慧研究中心,我作為研究中心的CEO,我們和很多品牌共同合作,這些公司在北京也有辦事處。(上圖)這些都是我們的合作夥伴,我們有時候也形成合作夥伴關係,一半是產業基金,一半是私營部門的資金。
今天我們的話題是長期自主。現在的AI只是短期自主,我們想要實現的結果,下一步是什麼?我們能夠給這樣的系統一些目標,只有通過更長的時間才能夠實現,比如一個月、半年或者兩到三年的時間這樣一個長度。比如你可以給一個工廠說,我想要既保證質量,同時用更少的資源等等。這樣的目標一天是完不成的,因此,這個系統需要長期的目標來調整生產過程,並且實現這樣的目標,那就是最終要節省資源。
在德國我們的策略就是把基礎研究放在五個領域,現在我們正在開發下一代的機器學習系統,叫做EMAL,可以從低質量的數據進行學習,然後逐漸去提升自己的水平,用簡單的方法,最後再提升學習的進程。第二,我們叫做IMMA,基於超連接性的沉浸式輔助,比如一些小的相機等等。在會場當中,我們就能看到一些類似的技術,叫做超連性。第三,自控系統,這是為了長期自主設計的,叫做SELA。第四是人類與機器智能的團隊合作(TAMI),我們想要把AI注入到這個團隊當中去。最後是可穿戴式的人工智慧系統。
德國提出工業4.0的原因是什麼?因為生產製造依然是德國經濟一個很重要的方面,在德國,兩個工作崗位有一個是依靠製造業的,製造業每年的出口金額達到1580億歐元,主要是一些工業的機械等等。這是我們一個很重要的產業,這就意味著我們必須要在製造業當中實現一個範式的轉移,IP工廠還有MES系統,要實現工廠的智能化。然後還有很多數字技術,能夠了解生產的過程,讓每一台機器、每一個產品都能夠互聯起來。
我們在幾個方面進行努力,在提供很多的軟體,不僅僅是給電腦和手機,很重要的一點,也給製造業工業提供軟體,這些軟體也是專門適用於製造行業的。在AI當中已經看到了四個階段,大家可以看到這四個階段是一個螺旋上升的。
第一個階段,當AI剛剛開始的時候非常簡單,那時候人們相信我們能找到一種普遍的問題解決方式,一個單一的數據結構來解決問題。當然失敗了,我們只能解決一些非常簡單的問題。
然後,人們就想需要更多的知識,知識就是力量,我們把知識傳遞給機器,這是第二個階段,基於知識的系統,效果還不錯,出現了很多成功的故事,但是也是有很大的局限,特別是很難以去把正式的知識輸入進去。因此,演算法很難實現。
第三階段,學習系統。
第四階段,認知系統。我們在這個過程中發現僅僅用機器學習來解決認知問題是不可能的。因為如果我們不能改變一些物理定律,這些物理定律可能是幾百年之前就已經發現的。因此,我們受到了很多方面的局限。
為什麼我們不用符號性的知識等等新的技術來實現機器學習?現在我們有最新的系統可以把知識和機器學習結合起來,這是我們未來的一種方式,我們把它稱為數字化的第二次浪潮。因為,數字化是很簡單的,每個人都可以做,我們也有很多的工具,只需要傳輸數據、存儲數據就可以了。但是現在問題變成,有了這些數字我們怎麼辦,我們怎麼樣分析它們,如果去進行語義分析,如何利用這些數據。
這些我們稱為機器可讀數據(Machine-readable Data)。自我學習系統正如剛才所說的一樣,它能夠解決曾經的一些大的問題。首先最大的問題就是編程程序員的問題,必須要把程序設計得很好,才能夠解決問題,比如JAVA。第二,我們稱為知識處理,有事實有規則有模型等等,這個模型很好,因為它能夠解釋自己的推理,但是問題所在就是很難獲取到足量的知識。第三,使用機器學習來獲取這些知識。第四,深度學習,我們有源數據、實驗數據等等,用數據來訓練數據,不需要去編程,這個是一個問題,這些系統很多時候沒有辦法去解釋它們自己的推理過程和行為。如果有很重要的決策需要做的話,如果非常信任這樣一個系統,可能在法律上就會有問題,因為會有一些責任的問題。如果你是一個律師或者其它的一些職業,如果你相信了深度學習網路的話,那可能最後就會陷入麻煩當中。
我們現在在做什麼?我們將符號層次的AI和亞符號層次的AI和深度學習結合起來。給大家舉一個很現實的例子,如果大家去領駕照的話,你不去觀察開車的方式,只是老師告訴你這個車應該怎麼開可能會很簡單,但是在應用當中可能會出現問題。有些路況很複雜,如何找到這樣一些複雜的道路當中的規則?取決於誰來,比如到了一個路口誰先到,所以這是一個符號體系。要成為一個好的司機的話,你必須要自己去開車才行,而不只是聽老師講規則,只能夠從實踐當中學習,這個就是我們稱為亞符號層次。不僅如此,我們還是有很多問題,現在還和很多公司一起解決的問題。
深度學習的開放問題
一個經典的問題叫做Overfitting,如果你在一個系統當中給它們太多訓練數據的話,就像運動一樣,可能訓練過頭了,這就意味著會出現一些異常的狀況。比如我們在自動駕駛汽車當中試過,數據放的越來越多,給它們越來越多的駕駛視頻來訓練,結果這個車被撞毀了。問題在於數據太多,導致這個系統出現了混亂。
第二,數據丟失。這是一個很嚴重的問題,因為在有些情況當中,找不到訓練數據。比如一個大熊跳到你的車裡來,出現這樣一些異常狀況的話,實際上我們是找不到這樣的例子和訓練數據的。我們在Youtube上面看了很多的視頻,如果說行車記錄儀有記錄到熊跳進車裡,人們基本都刪了,也不會上傳到網上。因此如果熊跳到車裡面的之類異常事件我們沒有數據可以訓練它們,這個叫做數據的丟失。
如果你給系統一些污染的數據,他們也會學習,但是就會有一些奇怪的行為,想要去刪除這樣異常行為的時候就很困難了。我們和Google進行合作,如何刪除曾經的機器學習網路當中得到的錯誤行為,如果你發現一些數據受污染了,怎麼辦?人很厲害,我們可以刪除一些錯誤的信息,但是在機器學習當中,要刪除一些錯誤的受污染的數據就比較困難。有很多不同條目的數據,這些數據很難被清除和甄別出來。
第四,很弱的解釋能力。系統的解釋能力有時候還太弱,現在給大家展示一下我們怎麼樣在團隊當中去使用機器人。
工業4.0:機器和人一起工作
在4.0時代當中,機器人不再是鎖在籠子裡面,而是和人類一起協作。這是一種全新的理念。
大家在這裡看到很多機器人,一個是很著名的品牌ABB,雙B系統,還有酷卡機器人叫做酷卡。這個機器人非常昂貴,大概超過一萬歐元,我們就可以擁有這樣一個混合團隊,這個女士說「誰來幫我扛起重物」,右側的女性仿人機器人,左側是酷卡機器人,他們就能幫助人類去完成一些任務。
在這裡我們有一個協作的例子,大家可以看到,在寶馬汽車製造當中,工人與機器人協作進行衝壓,這樣會節約很多,如果機器人單獨去做困難很多,單獨人去做也會很枯燥。最後我們的解決方案讓人和機器人來共同協作。
從經濟的觀點來看,在工業4.0時代遷回,在歐洲、日本很多公司已經決定把公司的業務外包到一些低成本的國家,比如泰國、馬來西亞、越南等等。但是現在隨著工業4.0的發展,人們希望很早見到他們的產品,也可能是同一天或者第二天交付,因為他們現在做的是將製造業重新遷回到客戶所在地,遷回到本國,這是一個很重要的理念。同樣,對中國來說也是很重要的,因為中國和德國比起來大很多,其實中國有很多不同的省,很多省有不同的工廠,有的小一些、近一些,我們出現了這樣一個遷回的趨勢。
在人類還有機器人的混合團隊當中出現了soft robot,軟機器人。在製造過程當中還有其它一些工藝當中給人類提供一些信息還有建議,在長期自動化當中很重要的一點自我監控、自我監管,和自我認知並不是完全相同的,但是它指的就是機器可以自己運用自己所能夠獲取的資源。比如我們要求它在某一個時間點去到達某一個地方,那它知道路上可能會遇上壞天氣,比如有大風或者大雨,那麼它自己知道什麼時候我可以等一下再出發。這就是說,機器能夠智能地去運用自己可獲取的天氣信息。還有感測解讀、認知、學習推理、規劃以及規劃認知,這是監控中很重要的一些元素。
我們現在還有在工業4.0以上新的國家的未來項目,有關自動化的系統項目,我們可以來使用機器人幫助孤寡老人,還有像在比較危險的建築項目當中也可以運用到這樣的機器人,例如災難之後可以用機器人幫助做災後救援。所有這些系統都有通信,它們所面對的問題,所遇到的問題都存在不確定性,這時候就需要用到機器人。
另外一個問題,模糊。比如說我們走在路上看到有一個路牌,它有特定的一些指令,我們在解讀路牌的時候可能會遇到的情況就是我們不知道這個路牌所指的具體是什麼意思,這樣的模糊也是我們遇到的問題。還有不完整,我們的資源是無窮的,但是機器需要能夠智能性地去解讀這些無限的信息。
剛剛講到了,今天我們所面臨的AI時代其中很讓我們激動的一點,就是現在需要鍵盤滑鼠的領域,我們將來已經不需要鍵盤和滑鼠了。現在我們人站在這裡,只要是一個表情或者一個動作就能夠給出信息,就能夠幫助人和人之間來進行交流,甚至在未來讓人和機器進行交流。比如像手上的手勢還有面部的表情,機器可以理解我們的這些動作,甚至生物的統計學我們都可以運用在這個領域,許多小工廠的工人也都需要最新的技術。
這也就意味著我們用這種多模態的助手,其中很有趣的一點,我們用Exoskeletons(外骨骼)做的物理助手,Exoskeletons是我們手上所戴的機器手臂,讓自己的手臂能夠做出需要更大力量的工作,我們叫做物理助手。比如說在中國我們需要去執行這樣一個動作,我們用這個機器人來執行這個動作的時候,很可能它的執行人背後的操作者其實是人在歐洲的,它可以遠程來進行操作。
最後我來對比一下人類智能和現在最好的人工智慧。我們可以看到,在Sensomotoric(感覺和運動)智能領域可以看到人類的智能會更好的,在這個領域我們更喜歡看人類的表現;在認知智能上,我們可以說在某些情況下人工智慧是要比人類智能更好的;在情商方面機器很差,更好的是人;在社會技能方面機器剛剛才開始,人會好很多。我們有很多事情可以做。我想在此強調,機器並不是想代替人類,我們想要彌補人類在認知方面的缺陷,幫助人來做更好的工作。
(本文首發於新智元微信公眾號:AI_era,歡迎關注!)
推薦閱讀: