從濾波與控制看人工智慧

世界上大部分的科學與工程問題本質上可以歸為兩類,即濾波與控制。

首先看濾波問題。濾波是一種信號處理的手段,用以從觀測到的信號中提取出你想要的部分或者特徵。從數學對應關係上看,濾波就是從一系列觀測值中獲得被估計變數的值。濾波器最早應用於信號處理與控制工程中。對於時間序列,濾波問題可以覆蓋很廣的範圍。假設要利用t1時刻及其以前的歷史觀測數據去估計t2時刻的值。那一般認為,如果t1>t2,則這稱為平滑問題;如果t1=t2,這就是狹義的濾波問題;如果t1<t2,則這稱為預測問題。從信號處理角度看,濾波器可以在頻域中設計,比如低通濾波、維納濾波等;也可以在時域中設計,比如經典的卡爾曼濾波;另外,濾波在圖像處理領域中,空間域可以相當於時域。廣義上的濾波就是從實際獲得的觀測數據中抽取需要的特徵,然後估計和判斷的過程。不管是頻域、時域,還是空間域,濾波問題都可有應用。目前人工智慧發展比較成熟的兩大應用即圖像識別和語音識別可以直接歸到濾波問題,因為圖像識別和語音識別是從圖像數據或者聲音信號中提取到特徵,然後估計判斷出期望的變數,只不過這個被估計是一個離散型變數。計算機視覺領域有很多方法也直接以濾波作為關鍵詞命名,如核相關濾波,而人工神經網路本身就可以看作一個濾波器。

信號處理中的濾波

再來談談控制。控制問題的目標是設計控制器使得被控對象的實際輸出達到期望值。如果控制過程中考慮被控對象的實際輸出而進行在線調節,那這就是閉環控制;否則就是開環控制。閉環控制是控制理論研究的主要問題,其核心在於反饋,能根據反饋的實際情況不斷調整控制策略,相比開環控制更能滿足性能要求。反饋控制思想存在於機器、人以及社會生活的方方面面。控制問題最終是要設計出控制器,一個完整的控制系統由控制器、被控對象和感測器組成(有時把執行機構也單獨拿出來,實際中根據關聯程度,執行機構可以歸到控制器或者被控對象中)。與濾波類似,控制科學中設計控制演算法可以在頻域或者時域內進行。早期基於伯德圖的頻域分析,後來出現了基於狀態方程的時域方法。用於非線性系統的現代控制理論大部分都基於時域。

控制系統結構框圖

反饋控制需要測量實際值的感測器,而實際信號中會有雜訊存在,這樣反饋控制系統會涉及到濾波問題。另外控制系統常常需要觀測器來獲得需要的變數值,這也是濾波問題。這樣看來,控制與濾波實際上關聯很大,密不可分。不過從數學對應關係上看,控制問題是要保持一個信號A儘可能接近另一個信號B,而信號B一般來說是完全已知的;然而濾波問題從A信號中估計出B信號,這裡雖然知道B信號的某些特性,但值是需要估計的。因此控制問題與濾波問題的目標是不一樣的。

按照深度學習的層次架構,底層是實際數據,越往上是越抽象的特徵。那麼從信號流動方向看,濾波過程是自下而上的,是一個信息不斷濃縮和提取的過程;而控制問題是自上而下的,是把期望值轉化為實際信號,一步一步地變成現實的過程。這樣,從哲學上看,濾波是在認識世界,而控制是在改造世界。而當下的人工智慧主要關注於濾波問題,不管是圖像識別和語音識別,還是自然語言理解和用戶畫像技術。因此現階段人工智慧的進步主要是停留在計算智能層面,利用數據、計算能力和演算法的進步很好地解決了各種濾波問題。基於信息處理的計算智能層面取得了巨大進步,機器已經在圍棋這種相當有智力挑戰的活動中達到成熟人類的水平,甚至超過人類的最高水平;但是,機器在運動智能方面依然不足三歲小孩,難以做到流暢地抓握取放、摸爬滾打、蹦蹦跳跳,現在工業機器人依然傻大黑粗,雖然出現了協作型機器人,但是依然需要很大的人力配合才能完成任務。總之一句話,運動智能不提高,即便有強大的計算智能,我們也不用擔心機器人會統治世界,因為機器不聽話,拔掉電源就可以了。

濾波與控制對比

眾所周知,當下人工智慧的發展屬於弱人工智慧的範疇,也就是說機器現在可以擅長單方面的人工智慧。比如可以在圍棋領域戰勝人類AlphaGo不會精確地投放廣告,人臉識別系統不會識別你的聲音。遷移學習能力目前也成為了人工智慧領域研究的重要課題。人有五大感官,具備聽說讀寫能力,每時每刻都在接受多模態的信息進行決策與推斷,目前機器難以做到同時很好地處理多種模態的信號。在弱人工智慧之後就是強人工智慧和超人工智慧。要想實現從弱人工智慧到強人工智慧的跨越,必須考慮多模態信息,實現遷移學習能力,並且提升運動智能。處理多模態信息就是濾波問題,而提升運動智能就是控制問題。

不管是信息提取的濾波問題,還是具體實現的控制問題,要想提升原有性能都有很大難度,不過就目前的基礎科學與技術發展而言,控制問題難度更大。控制問題的難點在於閉環和在線。控制系統本身包含多種形式的信息,比如機器人中電機的控制,需要考慮磁、電、光、力、位移等各種信息和干擾。目前工程上傾向於單獨考慮各部分,做到各個子部分達到一定精度。但從參考信號,到最後的輸出信號,整個閉環控制系統的各個子部分是相互聯繫的,這種聯繫不以人類的意志而轉移。即使採用相同的器件裝配而成的工業機器人,也存在裝配誤差導致的各種不確定性。現代控制理論大都基於模型建立,控制理論的發展過程就是不斷考慮被控對象更多特性和更多不確定性的過程。從最初的線性定常模型,到非線性模型,再到隨機模型。現代控制理論的發展在一定程度上改善了控制效果,考慮的因素越來越多,但控制器的設計也越來越複雜,並且有些複雜的高級控制演算法並沒有改善品質。深度學習的思想其實比較簡單,就是深度網路+特徵學習。如果將現有的深度學習、強化學習等技術應用到控制問題中,數據來源是很大的問題,因為需要的是實時在線的閉環數據,畢竟對於具有不確定性的控制對象,怎麼給出辨識過程的控制輸入滿足信號的豐富性,並且需要保證控制過程不造成損害。

機器人學中同時存在濾波和控制問題。校正運動學參數就是濾波問題,而提高末端跟蹤精度就是控制問題。將智能賦予工業機器人就是一個典型的運動智能層面的課題。在互聯網時代,最聰明的人都在研究如何精準地給用戶畫像從而投放廣告,這是一個濾波問題。相反,大家對運動智能關注不夠。當下人工智慧的巨大進步來源於演算法、計算能力和數據三大要素的支持,運動智能的發展可能遠不止這些。拋開資本推動、利益驅動等一些社會因素,運動智能會涉及能源、材料以及基礎科學的進步。因為更好的能源可以實現機器人真正地移動而不擔心續航問題,更好的材料是機器人接觸更多東西完成更多任務的前提,而機器人的自主學習就需要基礎科學理論的巨大突破。

某種未來的強人工智慧(來源於百度圖片)

我一直在思考,人工智慧與機器人學如何結合。隨著新一代工業革命的推動和人口結構的變化,相信越來越多的人會關注運動智能。就運動智能而言,當機器人能夠進行自主運動規劃完成組裝任務,那就是實現了強人工智慧;當機器人能夠自我裝配從而實現自動繁殖,那就是實現了超人工智慧。路漫漫其修遠兮,吾輩將上下而求索。

推薦閱讀:

最前沿:史蒂夫的人工智慧大挑戰
音箱先成「精」,「耳機精」還能吃到肉不?
神經網路從被人忽悠到忽悠人(三)
你好,若琪!你讓我們看到了家庭人工智慧,不僅僅是一個外表溫潤的機器人
度秘想要悄悄進入客廳,而且上來就把目標設在了5000萬

TAG:工业机器人 | 机器人 | 人工智能 |