北大訪問一天
因為在美國越呆越煩,所以跟導師申請了休假,從3.5號到4.1號,其實還有課,但是課的項目也可以回國做,沒有太大的妨礙。導師知道我在上海落地最後也會去北京就問我想不想去拜訪他在北京上海的合作者,我同意了。
我來北京之後第二天下午就去北大數學學院找楊老師了,楊老師是我導師早年的合作者,他們一起寫了好幾篇CT的理論文章,還寫了一篇如何評價教授的學術水平的文章發在PNAS上(羨慕導師天馬行空的想像力)。楊老師帶著他的兩個學生分別是博二和博三一起跟我交流,我們在茶室里坐下,暢所欲言,最後足足聊了兩個小時。導師常說,我們是engineer,楊老師和兩位博士師兄應該算是mathematician,跟數學家們交流想法真的很不一樣。
我首先說我的博士課題是做神經網路的可解釋性,具體切入點是模糊邏輯。北大數學學院有教授(比如 Bin Dong)嘗試用PDE來打破神經網路的黑箱,應該是可解釋性的數學學派,我們算是可解釋性的「工程學派」,工程學派就是半定性半定量。因為我也是臨回國前才和導師確定了這個方向,具體的東西我還摸不透,所以沒法回答他們具體該做什麼的問題,只是想到一個可能的好題目,用模糊規則搭一個自編碼器。
然後我問兩位師兄的研究課題,趙師兄課題是偏應用一些的,用神經網路做圖像壓縮,我先問他圖像壓縮和圖像的特徵提取的區別,然後跟他介紹了我之前寫的二次神經元的文章,他對新神經元的想法非常贊同,我們打算將來一起合作用新神經元搭建一個真正的深度網路來跑分兒,感覺以後可以co-author文章了。李師兄課題是用散射對形狀進行重建,李師兄給我的印象是一個很純粹的學生,他的課題也很數學化。聽到他介紹完自己的課題,我的第一反應就是格林函數法,記得格林函數最終解裡面有對形狀進行面積分的一項,李師兄說這是正過程,他做的反過程,他已經投了一篇文章給一個好雜誌「Inverse Problem」了,非常不錯的。話題說到反問題,我就聯想到我本科做的去模糊問題了。去模糊也是一個反問題,在這個課題里,我最大的疑惑就是:基於正則化的演算法能不能對圖像實現超分辨即能不能實現截止頻率之外的頻率分量的恢復,也就是說基於正則化的演算法收斂的解是不是等於原始圖像,如果他們空域上等於,頻域上不也一樣了嗎?楊老師說,目前只有證明是說演算法解的觀測值可以收斂到原始圖像的觀測值,目前還沒有針對我的問題的證明,不過他認為是不可能的,然後我想如果加上片段常數這個先驗條件的話是不是有可能呢?非常有意思的思考,雖然現在沒有相通,說不定以後就能明白了呢?
李師兄的第一個課題是對於值是常數的凸區域能否通過有限次照射就推算出這個凸區域的值和這個常數值,這個問題是我導師提出來的,原來CT裡面還有這麼理論的問題,我非常驚訝。最後我還跟兩位師兄們說了我在神經網路裡面引入同倫方法的想法,李師兄說他看過同倫這方面的數學,感覺將來如果我真做這方面的話也有人背書了。
Engineer確實需要有mathematician的支持,結尾附上我們在未名湖畔的合影
有興趣的小夥伴可以關注我的公眾號:純真學者出神入化: RPIBMEPhD
推薦閱讀:
※[貝葉斯六]之樸素貝葉斯分類器設計
※Accuracy,Precision, Recall, F-score,以及ROC曲線的總結
※薦書 | 機器學習、深度學習演算法及其Python實現
※機器學習演算法系列--生成模型與判別模型
※神經網路的理解
TAG:機器學習 |