觀測器的本質是什麼?

控制中對擾動設計的觀測器其實質是一堆濾波器的組合嗎?觀測器是否可以看作一個簡單的控制問題?


這個問題要看從哪個方面來理解。

先說「濾波器」的概念。一般來說,一個系統只要不帶反饋,只有前向通路,就可以認為是濾波器的一種,比如說是高通低通濾波器,帶通帶阻等。

問題標籤里提到了卡爾曼濾波器,在卡爾曼濾波裡面,用k時刻的觀測,去估計k-1時刻及以前的數值,叫「平滑」或者「內插」;用k時刻的觀測來估計k時刻的數值,也叫「濾波」;用k時刻去估計k+1時刻及以後的,叫「預測」。

控制系統裡面觀測器,包括干擾觀測器,如果也因為有去除雜訊和干擾的功能也叫做濾波器的話,這裡的濾波跟前面提到的濾波概念是不一樣的,這裡的系統實質上是帶反饋的,這個反饋一般就是濾波器的輸出和系統輸出的差y-hat{y}。在這裡把狀態估計的誤差e=x-hat{x}看作是狀態變數的話,可以認為是如何使用控制律,利用反饋信號y-hat{y}使得e的這個動態系統的狀態都趨向於0。

目前我見過的干擾觀測器,大多是建立一個標稱模型,把建模誤差,雜訊,還有實際的外部干擾都給增廣為一個新的狀態變數。只要這個增廣後的模型是可觀測的,在設計觀測器的時候跟傳統的觀測器並沒什麼區別。


有很多角度,有很多本質。

1. 確定系統,可看作是廣義的動態的(迭代的)inverse mapping,如果y_{k} = f(x_{0,...,k}), 那麼x_{k} = g(y_{0,...,k})?

2. 隨機系統,可看作最大「信息」榨取, 比如可從whitening的角度。

但說了,本質不止一個,比如隨機系統,是whitening更本質,還是最大似然估計最本質?回答這個問題,可能需要更深入一層,探求本質的本質。。。

--

控制、估計本質都是反饋問題。其實很多其他領域的涉及到迭代的演算法,也本質都是反饋問題。


從我熟悉的動力系統角度回答一下。

設計觀測器的目的是為了估計系統中未知的部分(狀態x,參數p,擾動或故障d),進而依次對應控制(control)、參數辨識(identification)和監測(monitoring)。題主所說的對擾動設計的觀測器,是屬於上述的第三類,即所謂的擾動觀測器。很多情況下擾動觀測器的原理是將擾動看作一個擴展的狀態(extended state),設計一個擴展觀測器。

上面提到的擾動觀測器是否是濾波器,這就涉及到觀測器和濾波器的關係。很多情況下,都對觀測器(estimator)、濾波器(filter)和估計器(estimator)不加區分。狹義上,各種情形下下(是否考慮統計特性、隨機特點、參數變化、結構、輸入輸出)都有自己特定的叫法,不過區分並不嚴格,例如論文中經常出現「under xx, the extended Kalman filter becomes an exponential observer", "high-gain observer/filter" 這樣的語句。

最後一個問題關於觀測器是否可以看作控制問題,在一定條件下是可以的。 常規的觀測器設計就是直接考慮狀態重建,這就涉及到估計誤差的穩定性、重建速度與抗雜訊等特點,這在某些方面和控制問題有些類似。在這種思路下,設計observer-based feedback control,在論文中也很常見。觀測器理論的代表學者Gildas Besancon 於2015年在System Control Letters上提出了一種control-based observer的觀點,和題主所說有些相似,這樣的優勢可以更容易處理未知輸入的估計,同時可以利用相對更為成熟的控制方法來設計觀測器。題主說的,看作一個簡單的控制問題,這個「簡單」表述不是很合理。需要滿足Besancon提到的一些條件,一年多的時間到現在尚不能讓這種思路很成熟,論文所舉的結構很簡單例子,構造技巧也比較強。


迭代/反饋/動態逆。


不請自來。

何為觀測器,本質上這種叫法是把觀測誤差的演變過程視為一個動力系統。


①就我目前所涉足的研究來看,對擾動設計觀測器這一說法是不對的。設計觀測器的前提是需要知道該系統的狀態方程,即可以對該系統建立數學模型。

擾動作為系統中的未知參數的形式出現,既可以出現在系統中,也可以出現在系統的輸出,亦可同時存在。而所設計的觀測器系統中並不含有擾動,我們則通過設計出合適的觀測器增益來使得誤差e等於0漸進為0。(誤差e等於原系統狀態減去觀測器系統狀態)

②余以為,觀測器與濾波器並不能等同,觀測器的實質是對原系統進行重構,而濾波器更多的是對原系統的輸出進行特徵提取或是優化等等。

③觀測器的設計問題與控制問題也不能等同,觀測器僅僅是對原系統進行重構,其中並未對原系統做任何的動作,原系統也好、觀測器系統也好,其收斂還是發散,都不會有任何的改變,控制二字並無從談起。而控制問題,則是通過添加控制器來使得系統從一個我們不滿意的狀態變成一個令我們滿意的狀態,比如原本發散的系統,通過控制器,我們可以使之收斂,但觀測器僅僅是另外構建了一個與之相似的發散系統,並不能使之收斂,若要收斂,則需要基於觀測器系統做控制器設計。

手機碼字,請見諒。以上定有偏頗之處,還請指正。


觀測器(比如DOB)實際應用效果貌似都有限制,從含有雜訊和不確定因素的信息裡面觀測出擾動還是比較困難的。


如果你對這篇文章里的擾動觀測器(時域和頻域)有任何問題直接留言我,模擬在researchgate 上:Su, Jinya, Wen-Hua Chen, and Jun Yang. "On Relationship between Time-Domain and Frequency-Domain Disturbance Observers and Its applications." Journal of Dynamic Systems, Measurement, and Control (2016).


聽來的。 觀測器都是基於誤差的反饋


推薦閱讀:

PID控制器適用於怎樣的被控對象?
弦(梁)的振動方程怎麼轉化成控制系統中的傳遞函數?
潛意識可控制嗎?
原始卡爾曼濾波演算法(KF)、擴展卡爾曼濾波演算法(EKF)以及無跡卡爾曼濾波演算法(UKF)三者之間的區別?
控制的未來在哪裡?

TAG:自動控制 | 濾波演算法 | 控制 | 控制理論 |