機器學習,神經網路在控制科學中的前景和應用大嗎?為什麼?

以前學習機器學習的時候看到有應用演算法來訓練新式機器人自我移動的案例(來自斯坦福機器學習老版本課程),覺得很激動,因為這個過程很像生物界的學習過程。
最近控制理論學習更加深入,也和老師討論過這個問題。自控理論的老師認為當前行業里不太看好神經網路控制的論文,認為水分大,也不夠有技術含量(可能不夠純數學==)。過程式控制制的老師(是一個很有經驗的工程師),非常不看好這樣沒有經過實踐驗證,魯棒性沒有保證的演算法,認為這個只是理論上的,實踐上難以運用。
但是我想,自動控制領域偏向純數學的建模真的好嗎?1,模型本身就是不精確的,各個部件的模型隨實踐也會改變,模擬的結果可能實際中根本就達不到。2,控制系統日趨複雜,耦合度加大,想要控制如同人一樣的機器人,從關節,耦合的表示上就已經很複雜,數學的複雜度必然會限制它的應用。
而實際中,1,生物的控制,人的走路,抓取,奔跑,就是長時間訓練的結果,模型的精度和可靠性隨著我們使用的次數變得越來越高,2,每個人生來就是不一樣的,時間增長,每個人會長高,對應在控制理論里就是傳遞函數的變化,可是人能夠很好地適應,說明這個演算法適應能力很強,也有很高的通用性(不同的人都使用相同的方法)。
所以我的問題就是如上問題。
、、、、、、、、、、、、、、、、分割線、、、、、、、、、、、、、、、、、、
希望大家能參與討論,解決我的疑惑,也算是在討論控制科學未來的發展吧


讀論文寫程序弄得有些身心俱疲。
先放結論,和個別我關注的實驗室,過幾個月再來填坑,說一說我了解的主流結合方法。

結論是:統計學習方法(我現在關注的主要是貝葉斯推斷)和機器人控制的關係很大,而且也是現
在國際上研究的重點。

實驗室:

UCB Pieter Abbeel---Associate Professor UC Berkeley---Co-Founder Gradescope---(Deep Reinforcement Learning)

UW Emo Todorov

StefanSchaal Computational Learning and Motor Control Lab(不是哲學家啊.....他學生在01年弄出來的MDP完成了很多很awesome的成果,比如說擊球,還有「請球入瓮」)

Jan Petershttp://www.ausy.tu-darmstadt.de/Research/Overview(Schaal 的學生,reinforcement learning 的大牛,IJRR上面的RL survey就是找他們實驗室寫的,論文請戳這裡(http://www.ias.tu-darmstadt.de/uploads/Publications/Kober_IJRR_2013.pdf),前幾年在教機器人打乒乓球)

還有ICRA2015的明星paper "Learning Contact-Rich Manipulation Skills with Guided Policy Search"的作者

Sergey Levine Sergey Levine(今年已經去了UW了,和Todorov勾搭上了,兩個人還合著了一篇ICRA,然後橫跳到了berkeley還是跟了pieter abbeel)

Levine的這篇論文中,作者就是用統計學習學習的方法,結合了傳統的控制理論,對一個神經網路的參數進行了優化。把這個神經網路作為機器人的控制器,控制機器人完成了一系列複雜動作。


題主的問題是 機器學習,神經網路在控制科學中的前景和應用大嗎?為什麼?
首先需要澄清的是神經網路只是機器學習的一個模型,也是控制論的一個模型。
她最簡單的形式的本質是多個非線性函數合成的函數。
f_{all}(vec{x}) =f_1 circ f_2 cdots f_n(vec{x})<br />
f_i(vec{x})equiv sigma(Wvec{x}), forall i in {1,2cdots,n}sigma是一個非線性函數,比如tanh。
這樣看來他其實就是一個數學模型,並沒有什麼特殊之處。而且它和生物界的學習過程差很遠,只是最初步的優化,要是考慮相似性,IBM neuron morphiccomputing更像一些,效果卻不是很好。

下面正式答題。
不好意思,在此暢所欲言,拋磚引玉,也希望聽到大家的觀點。
我在這兒把控制科學等量於機器人學來討論,我相信這樣簡化並不會減少大家的興趣。
機器人學把對機器人的操控分為兩部分, 一部分是perception, 一部分才是傳統意義上的控制,control。

機器學習對於第一點,perception,的作用不可謂不深。無論是監督,非監督的方法對機器人視覺,語言,情感都有不可磨滅的貢獻。舉幾個例子,1. 在視覺識別和分類上面,基本都是機器學習的一個模型(卷積神經網路CNN)獨佔天下。大家可以看看這個資料庫The KITTI Vision Benchmark Suite,基本在每個識別競賽下都是CNN的改變版本第一名。2. 在情感計算方面,機器學習提供了在數據量大的情況下,識別當前狀態下的情感的可能。Stefan Wermter用Recurrent Neuron Network(RNN)的模型分析twitter上每個狀態的情感從而讓機器人針對不同的情況做出不同的反應。機器學習在perception方面作出的貢獻其實是對控制非常有用的,和Sensor Fusion結合在一起,他其實提供了機器人一個更真實的反饋。 只不過這個方面在傳統的控制演算法當中不受重視,我也就不在贅述。

第二點就是傳統意義上的的控制演算法了。由於在計算機科學歷史上,控制演算法並不是主要的研究方向,所以學習演算法在這個方向上的發展就有些慢。(傳統上計算機科學的主要研究方向是圖像和NLP)。而且以前的控制演算法不需要多少輸入,和動輒 1086 x 1086 x 3 x n 輸入的圖像研究不能比。所以人們傾向於找簡單的方法(比如各種判定依據)。這一點上和圖像的早期演算法是相似的,都是人工的找判定依據(比如某種物品的判定依據)。計算機圖像學之所以發生改變,是因為人們發現判定依據太過複雜,而計算資源又有發展,所還不如用學習演算法學習這些特徵。我覺得控制論也在往這個方向發展。現在很多控制演算法開始大量考慮優化問題,我覺得就是趨勢。優化問題普遍需要數據,很快控制演算法就會和學習演算法合流(基於機器學習已經合併了統計學習,以後機器學習也可以合併控制演算法)。

那麼從機器學習本身發展出來的控制演算法有沒有呢?答案是有的,比如說總有幾個神人,比題主和答主早個幾十年開始考慮這個問題. 哲學上有名的人是Stefan Schaal,他的文章Is Imitation Learning the Route to
Humanoid Robots?是對這個方向最直接的思考。雖然中國對這方面的了解還比較少,但是這篇文章已經有近1000的引用了,說明各國科學家還是很看好這個方向的。這之後很多人有過嘗試,但是由於基本是零起步,所以並不是很成功。然後,然後一個叫增強學習方向立功了,這個方向也許很多人都不了解。他是基於強調如何基於環境而行動,以取得最大化的預期利益來學習。也就是說這個機器學習方向的數學模型允許試錯存在,也就是你可以嘗試,並在錯誤中學習。具體的數學模型可以參見Sutton的Book。

由於數學比較複雜,在比較的少的時間不好解釋。我就簡單的帶一下他的發展史,在發現增強學習中的馬克沃夫決策過程(MDP)可以解決控制問題之後,人們又發現,連續的控制過程離散化之後數據會變得非常大。於是就開始直接優化在決策函數的超參數(叫做Policy Gradient 策略梯度方法),發現學習演算法終於可以和傳統控制有的一比了。

不過學習演算法和傳統演算法還有些缺陷,比如題主剛剛說的精確問題,普通學習演算法精確度就和普通控制演算法比就有些問題(畢竟人類幫這些控制演算法總結了物理定律),神經網路就更差了。精確性是神經網路一個非常嚴重的問題,控制問題對模糊的容忍度比識別問題低的多。因為一次不好的控制就會導致的機器人損壞或者報廢。就算在機器人學習演算法的大牛裡面對神經網路也是慎之又慎。大家一般都是傾向於用容易算出bound的基於馬克沃夫決策過程的增強學習演算法和容易求出方差的高斯過程回歸。一個有趣的事實是,雖然大家都擔心神經網路,但是一直都有嘗試,因為它好處也太多了。比如和在部分領域最好的perception演算法結合,比如訓練過程簡單,比如scalability非常好。解決對神經網路不信任這個問題,我覺得人們需要發展新的數學工具去解釋比如CNN,RNN的複雜神經網路。

我認為隨著計算能力的增強,控制演算法轉向學習演算法是不可避免的,因為慢慢所有的反饋都由大量的數據組合而成,而沒人想一個一個分析。現在人們在研究結構性重組,高斯過程回歸,深度學習對演算法的改進。而這是我們的時代。

btw.
跨過GFW的朋友可以看看這個論文相關的視頻,可以對學習演算法如何進行控制有個直觀的概念。
https://www.youtube.com/watch?v=ualnbKfkc3Qlist=PLD3r59GwPNy03mxmI17UJqGmiCZQ_b7YLindex=1


神經網路的應用前景主要是它的自學習和自訓練,就是說當外部的pattern變化的時候網路的架構和訓練法則不變,這樣就更接近於人的認知過程。我覺得機器學習特別是神經網路模型的建立就是為了解決一些傳統演算法解決不了的事情。比如你用卷積神經網路(CNN)去對圖像特區特徵,進行分類,用帶記憶功能的周期神經網路(RNN)去做NLP,語義分析,情感分析,上下文分析等等。你可以用LSM去提取腦電信號EEG,肌電信號EMG,然後分類給出一份健康報告等等,至於DBN,RBM這些深度學習典型的演算法就更有可以利用的地方。然後可以把上面的傳統演算法轉換成SNN(spiking neural network),然後提出新的學習法則,訓練法則,去探究神經元之間的連接,權重的配置等一系列問題。從CS的角度來看,個人還是堅持人工+生物混合智能。


作為控制科學與工程的孿生兄弟信號處理表示,已經快要被深度學習完全攻陷啦


前景是無限的,目前應用的限制完全不能否定它的前景。

螞蟻的神經元有250,000個,我們現在人工神經網路里的神經元有多少個?根本不在一個數量級。而且我們對腦功能的了解非常有限,現在人工神經網路是2D的,腦神經元則是3D的連接。
即使是這樣,在圖像識別和手寫字元識別的領域,人工神經網路已經能擊敗人類了。這充分說明了這種仿生學方法的潛力。

另外,你說的那些機器人行為(有障礙行走,物件抓取)本身是建立在對世界的有效感知(模式識別)的基礎之上的。現在人工神經網路正是在模式識別領域裡發展的如火如荼。要在控制領域裡大顯身手,先把模式識別的問題全部解決了再說。


個人愚見,不當之處請多指教。
神經網路控制可以分開兩部分來理解,人工神經網路和自動控制。隨著第一台蒸汽機的發明,控制系統從線性時不變發展到現在的非線性時變,建模對象越來越複雜,自動控制現在基本可以實現,重要的是人工神經網路。
簡單點說,人工神經網路,憑藉現在的技術水平實現不了,現在做的神經網路只是建模之後的模擬,最根本原因,是還沒有一台神經網路計算機來建模,只能用馮諾依曼式的計算機來模擬,但是馮諾計算機很多特性跟神經網路是本質區別的,舉兩點例子:神經網路是並行處理數據,但是馮計算機是01010的串列處理數據;第二,神經網路的存儲在每個單個神經元,每個神經元即是處理器又是存儲器,但馮機是分開的。幾個特性的不同,決定了處理、學習、控制方式的不同,從本質上覺決定了現在只能對人工神經網路進行模擬,而不是更逼真的去建模,於是神經網路的一些特性也會大打折扣。
而且,神經網路計算機不知何時才可實現,所以有點前景遙遙無期的感覺,沒有實物,也會感覺有點虛。除非有非常大的興趣愛好,否則很難把研究放到這個有點虛無縹緲的對象上去。
但是我認為神經網路的潛力是巨大的,要做到真正的智能控制,只能靠神經網路控制。現在從神經網路研究得到的一些模擬模型和一些理論雖然不多,但是已經對自動控制起到了很大的作用,很多也在工業中有了應用,此處不贅述。
更欣慰的是,也有著一大批前輩學者們正孜孜不倦的繼續為實現智能控制而不懈研究著,相信終有一日,其會綻放光輝。
2015.7.3
~~~~~~~~
題主問到前景,我覺得,短期前景不大,最多只是單個理論上的突破與應用。遠期前景非常大,如果能成功就是第四次或者第五次工業革命,機器人,智能意識甚至終結者中的天網,安德的代言中的智能都可能產生,所以我感覺這是個很重要又慎重的問題,但也要是這個世紀末或者以後得事了吧,哈哈。總而言之,現在看智能控制,很玄,就跟周易八卦一樣,又神秘又虛,但是確實含金量很大。
~~~~~~
2016.3.27
最近圍棋事件很火,也有朋友在評論里說了寒武晶元,個人感覺這些都是深度學習(訓練學習)方面的進步,神經網路控制其餘同樣重要方面的進步還有待考證。個人愚見,目前離實現真正的神經網路控制(智能控制)還有一段距離。當然,這是我的錯覺最好。


我覺得大家舉得例子都很好。對比quora上的悲觀言論我覺得我們國人確實在這個方面更加朝氣蓬勃一些!


雖然我是本科准大四,不過我認為這個方面我還是有一些想法的。

傳統的控制論是由簡至繁,從底層向高層走,從局部向系統發展。一步歩基於之前堅實的累積。
但可惜的是目前工業界僅用pid就取得了很好的效果,可見解決問題不一定需要事事求精。我認為控制論的路還非常的長。還有很多可以完善的地方。


我所在的學校這個方面的大神有很多,而這個方面對數學和空間的理解要求非常之高。
舉個例子,我們如果model一個系統,如果它是非線性,有多個未知變數,已經是極其困難的了。從純數學角度出發,我們雖然可以進行解析和理解,但其複雜程度呈幾何增長。

這是從數學和物理角度進行理解和分析,如果我們走形而上學的路,不求甚解,而只在已知條件下達到控制要求其複雜程度就大大減少,也大多不會是一個幾何增長的複雜問題了。

所以我覺得特殊環節採用控制論,而整體則使用機器學習的方式進行控制,將會大大減小問題的複雜程度。

由於如今人工智慧和機器學習尚未發展到真正的智能,離理解問題的本質尚有非常遠的路要走,我們不妨不要把事情看得那麼清楚,只要知道多數情況下的多數解即夠用。

我個人認為,機器學習做的再好,有時候也不如將問題本質看清楚來的透徹,精確和好用,所以控制論的研究仍然有不可複製的作用。但機器學習可以讓我們在複雜情況下以較小代價獲得優解的作用,更對實際應用具有巨大意義。

方法沒有高低貴賤,但又好用不好用的區別,用鉛筆多練練也能畫個圓解幾何題,雖然圓規很好,但若是老是造不出來就先用鉛筆吧,把題解決是主要的。

但我覺得控制論這樣走下去博士沒讀完都是很難有巨大貢獻的,所以沒有強烈興趣的人我覺得不要走這個科研方向。向在控制論科研一線奮鬥,為世界貢獻人生理想的的大神們致敬!


https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf


人工智慧已經發展了幾十年了,至於理論研究的技術奇點什麼時候到來還不清楚,但可以預測的是隨著物聯網,大數據等等的興起,在實際應用方面會快速增長。
在控制方面,也會有很大的應用,比如3級倒立擺神經網路的實現,通信技術神經網路的控制等等,所以說有很大應用空間。
至於你的老師說太理論,沒有數學,但是很多情況都是不確定的,模糊的,基本上很難精確表示。還有在控制工程方面,模糊控制,神經網路應用很多的呀。
綜上所述,我個人認為人工智慧方面在未來的前景還是很好的,而且隨著互聯網巨頭的不斷投入,會有很大的一個發展,巨頭們吃肉,我們也能喝著湯啊!

第一次答,不好見諒啊


用機器學習的演算法實現精確的運動控制,完全不適用精確的數學模型?

或是用機器學習優化基於模型的控制,這樣達不到智能的效果!


PID控制是EKF的特例,EKF是RNN的特例,RNN又是LSTM的特例。PID和EKF都是用於控制的,所以RNN和LSTM能用於控制也就不奇怪。這些方法都是對時序關係的刻畫,控制也是屬於對時序關係的刻畫。

PID的時間步之間的關係是簡單線性關係,參數靠經驗設定;EKF稍複雜,時間步之間為物理建模關係,參數也需要靠經驗設定;RNN的時間步之間關係是非線性,參數通過數據學習,且每一步必定有輸出;LSTM的時間步之間關係是非線性,參數通過數據學習,且不一定每一步都有輸出。

P.S. 最近CNN技術有侵襲RNN傳統優勢領域的趨勢,比如語音識別會用到CNN,Facebook的Fairseq完全用CNN來替代LSTM原來的角色[1]。當然Fairseq用了LSTM的gate技術。反過來LSTM也在開始玩dropout等CNN的傳統技術[2]。刻畫空間關係的CNN和刻畫時間關係的RNN有相互借鑒的趨勢(當然時間和空間兩者本質是高度統一的,何必介意刻畫的是時間還是空間)。

所以哪天如果CNN被用於控制了,也不要驚訝。

[1] 知乎 - 知乎 參考 高英愷 的回答。

[2] Gaofeng Cheng et al. "An exploration of dropout with LSTMs", INTERSPEECH 2017.


我國的認知神經科學研究有兩大特點和優勢:多學科的聯合研究和多層面的研究手段。由於認知神經科學是多學科的綜合體,雖然國外的研究者個人水平相對較高,但學者之間的合作非常少。國內所推行的「大科學」概念,傾向於結合各個學科解決問題,有利於多層面的研究和學科問題的解決。


成千上萬不算多,我們人類生下來後要花很多年來學習


我最近在做過程式控制制的項目,用的主要是模糊控制。感覺機器學習在模糊控制的規則提取上可以獲得很好的效果。神經網路、遺傳演算法、支持向量機等與模糊系統的結合也已經有不少研究了,在工廠里也有成功應用的案例。


個人覺得非常大。
現代對機構學的研究已經非常深入了,尤其是仿生學機器人的機構,在試驗條件下,基本可以接近要模仿的生物特徵。但是,我們還不能研究出有思想,有智慧的機器人,我覺得其中一條主要原因,就是演算法。
最近,卷積神經網路非常熱,谷歌、百度等公司都在做,並且也非常熱。上個月,聽過一個報告,經過深度學習的卷積神經網路對圖片的識別率已經超過人了。
但是有兩個問題。一是這種超越是在某一個方面,例如可以識別人臉,但是識別不了數字。二是需要大量的數據進行學習。為了達到較高的識別率,可能需要成千上萬的學習樣本。
我想,解決了這些問題,我們就有可能做出真正的智能,肯定能引發一次新的革命


神經網路如果運用於運動控制,亦或者說更高級的仿生控制,他們需要新的機械物理範式,並不適用近代機械經典結構。


能處理大數據,當然應用大。


來個通俗的.

開門如何聲音小, 節約能量, 門軸受力小?

讓機器人每次開門, 記錄以上信息, 不斷進行窮舉式搜索.

得到的控制路徑要比簡單的路徑規劃軟體好,

得到的力控制要比力-位混合控制好.

得到的雜訊, 門軸受力, 機器人速度, 各關節能耗, 各關節壽命損耗, 都可以得到協調的優化.

從ML 選擇DL, 從DL走向GANs, 這幾年的進步很快

TensorFlow及其擴展模塊在行業內的應用是顛覆性的.

原來100萬左右1個教授帶隊團隊1年才能開發完成的工業級視覺識別軟體, 現在10萬2個研究生兩三個月就搞定了. 血洗的架勢, 也是一個巨大的藍海. --我們在幫助AI教會全球幾億個攝像頭具備智能.

語音, 文本, 也都如此.

控制領域才剛剛開始, 大部分控制領域的人還在教學自控原理1PID, 自控原理2多變數矩陣控制, 控制實踐被計算機和互聯網和大數據這一群老司機帶飛了, 眼睛跟不上, 理論跟不上. 大量科學問題需要解決, 在解決之前, 需要重新定義.

清華自動化小本一名, 著急.


推薦閱讀:

TAG:人工智慧 | 機器學習 | 自動控制 | 神經網路 | 機器人控制 |