信息幾何(Information Geometry)這個方向前景如何?

題主是做信號處理的,最近研究的問題涉及到這個方向。信息幾何目前國內研究的人似乎不多,想聽聽知乎各位大神的意見。

補充一些論文里的描述:信息幾何是在Riemann 流形上採用現代微分幾何方法來研究統計學問題的基礎性、前沿性學科, 被譽為是繼Shannon 開闢現代信息理論之後的又一新的理論變革, 在信息科學與系統理論研究領域展現出了巨大的發展潛力。


先上結論:這個方向還是不錯的。

從上學開始,我們的基本上都是先學幾何,再學統計。為什麼?幾何有比較強的直覺感受,三角形,方形,圓形什麼的。計算他們的周長、面積、邊長比例也有實際的應用場景,比如買房什麼的。當幾何跟分析結合起來的時候,幾何就變得有點困難了。基本上就是現在所說的流形。什麼是流形呢?就是一堆集合以及集合上的距離度量。給定集合,但是沒有度量的,那是拓撲(不在乎距離,只在乎連通性)。幾何是一個非常大的研究領域。單單就流形就有很多種,他們又有各種各樣的性質。

統計或者概率的發展本身就比幾何晚很多。這裡面涉及數學體系的完善問題,也說明了統計本身作為一個分支的難度。但是從描述事物的準確性方面來說,概率確實比較合適,比方說預測股票、天氣等等。給出一定的概率分布要比給出一個結論要有用得多。隨著現在大數據的發展,對於這種不確定數據的描述,概率論已經成為不可或缺的重要工具。可以毫不誇張地說,沒有概率論就沒有機器學習。概率論的重要性不光在於對於已經發生的事物的描述,還可以對未來的事情進行推斷,這也是它非常有用的地方。現在大部分的推斷都基於貝葉斯公式。

統計的大部分情況是在低維流形上的採樣,也就是說,採集到的數據是低維流形在高維的嵌入。顯然,數據的混亂性導致流形本身不光滑,也就是說需要加入幾何約束。同時,這些採樣點本身又滿足特定的概率分布,從而概率和幾何之間是有聯繫的。

概率幾何和幾何概率應該就是這兩者相互結合的產物,也是非常新的科學分支,目前找個中文材料都困難(也許是我不太熟悉的緣故)。但是這兩個結合確實是非常有意思的事情。比如我的一些工作就是想在幾何曲面上加入概率分布約束(Spectrally regularized surfaces)。這是因為在數字圖像裡面,圖像本身就是一個隨機場,概率分布十分重要。同時,數字圖像也是一個幾何曲面,幾何約束也非常重要。如何把這兩者結合起來卻不是那麼顯而易見,甚至會相互衝突。所以說,數字圖像和機器學習這兩個地方很可能就是信息幾何大展拳腳的地方。沒有特定的應用場景,再牛的數學工具都只能束之高閣。只有合適的數學工具,沒有好或者壞的數學工具。用合適的工具做合適的工作,基本上,就會導致很漂亮的結果。

現在的信息幾何不光考慮統計和幾何的理論,而且要考慮如何計算,比如計算複雜度什麼的。對於數學家而言,永遠都是先連續推導,然後才離散計算。對於計算機科學家而言,永遠都是先離散數據,然後再做計算。這兩個在不同的應用場景下會有不同的優勢和劣勢。在某些特定情況下,甚至導致截然相反的結論。所以對什麼時候做計算要特別留意。一個簡單的原則就是:連續地思考,離散地計算。


時間久了,你就會發現,很多問題的本質就是幾何問題,這點在machine learning裡面尤其突出(不包括Deep learning)!


給大家推薦一本書,《信息幾何方法》,日本人寫的,有英文版


話說我想考概率論的方向,不知道有什麼前景π_π


流形學習這方面研究其實挺久了,國內的何曉飛教授在這方面有很好的研究成果。


信息幾何:

是基於微分幾何發展出來的一套理論體系。主要應用於統計分析、控制理論、神經網路、量子力學、資訊理論等領域。

可以看這個:http://www.docin.com/touch_new/preview_new.do?id=676871642


推薦閱讀:

為什麼蘭州大學數學系能排名世界第37名,成為中國區第一?
如何證明沒有無窮項的每一項均為質數的非常值等差數列?
π是如何定義的?
1=4 2=8 3=16 怎樣說明4=1是不對的?
如何用抽象代數的方法證明數論里的歐拉定理:若(a,m)=1,則a^φ(m)≡1(modm),?

TAG:數學 | 機器學習 | 微分幾何 | 資訊理論 |