ICLR 2018最佳論文重磅出爐！Adam新演算法、球形CNN等受關注

04-27

今天，ICLR官網公布了ICLR 2018的最佳論文，一共三篇。這些論文在被ICLR接收之後持續得到討論，包括提出新的Adam變體演算法，處理球面圖像的問題的球形CNN，learning to learn框架的持續性適應問題等。本文帶來詳細解讀。

論文地址：

On the convergence of Adam and Beyond
Spherical CNNs
Continuous adaptation via meta-learning in nonstationary and competitive environments

關於Adam演算法收斂性及其改進方法的討論

最近提出的一些隨機優化方法已經成功地應用到了神經網路訓練任務中，如RMSPROP、ADAM、ADADELTA、NADAM等。這些方法都是基於梯度更新的演算法，在更新的過程中，利用了歷史梯度平方的指數移動平均值的開方進行縮放。而根據觀察，在許多的應用中，如輸出空間比較寬泛的情況，這些演算法無法收斂到最優解，或是在非凸問題中的臨界點。文中證明了收斂失敗的原因是，演算法中使用了指數移動平均值。文中舉了一個簡單的例子來證明，即使是簡單的凸優化問題，Adam也無法收斂到最優解，並在文中描述了Adam演算法分析中以往存在的關鍵問題。分析表明，通過將這些演算法與歷史梯度的「長時記憶」相結合，可以解決收斂問題，並提出了新的Adam變體演算法，該演算法不僅可以解決手鏈問題，也能軋線經驗性能。

本研究的貢獻：

通過一個簡單的凸優化問題闡述了TMSprop和Adam中使用的指數移動平均是如何導致不收斂的。而且文中的分析可以擴展到其他的指數移動平均打的方法上如Adadelta和NAdam。
為了保證演算法的收斂，文中使用歷史梯度的「長時記憶」。並指出了在以往論文Kingma&Ba(2015）中關於Adam收斂性證明過程中存在的問題。為了解決這個問題，文中提出了Adam的變體演算法，演算法在使用歷史梯度的「長時記憶」的情況下，並沒有增加演算法的時間複雜度與空間複雜度。此外，文中還基於Kingma&Ba(2015)給出了Adam演算法收斂性的分析。
提供了Adam演算法變體的實驗證明，結果表明，在某些常用的機器學習問題中，這個變體的表現演算法相似或優於原始演算法。

實驗結果：

如圖1所示，在一個簡單的一維凸問題上，對Adam和AdamSRAD的性能比較，受到了非收斂性的啟發。前兩個圖是用於在線設置，最後一個是用於隨機設置。

圖1

如圖2所示，在邏輯回歸、前饋神經網路和CIFARNET中對Adam和AMSGRAD的性能比較。上面一行顯示了ADAM和AMSGRAD在邏輯回歸（前兩個圖）和隱藏層=1的前饋神經網路（右圖）的性能。在最下面一行中，這兩圖比較了Adam和阿AMSGRAD訓練和測試，並基於CIFARNET進行了比較。

圖2

球形卷積神經網路（Spherical CNNs）

卷積神經網路（CNN）可以很好的處理二維平面圖像的問題。然而，對球面圖像進行處理需求日益增加。例如，對無人機、機器人、自動駕駛汽車、分子回歸問題、全球天氣和氣候模型的全方位視覺處理問題。將球形信號的平面投影作為卷積神經網路的輸入的這種天真做法是註定要失敗的，如下圖1所示，而這種投影引起的空間扭曲會導致CNN無法共享權重。

圖1

這篇論文中介紹了如何構建球形CNN的模塊。我們提出了利用廣義傅里葉變換（FFT）進行快速群卷積（互相關）的操作。通過傅里葉變換來實現球形CNN的示意圖如下所示：

實驗結果：

文中使用官方指標評估提出的訓練模型，並與每個類別的前三個最優模型進行比較，結果如表1所示。除了精度和F1@N,本文提出的模型排名第三，它是每個其他指標上的都處於領先位置。主要的競爭對手，Tatsuma_ReBGG和Furuya_DLAN使用對SHREC17任務專門設計的特徵和網路結構。考慮到文中提出的模型的任務不可知的體系結構和模型中使用的有損的輸入表示，可以將模型的性能解釋為對球形CNN的有效性的強大的經驗支持。

表1

2. 以RMSE作為指標，將提出方法與一些其他的方法做比較，如表2所示。從表中可以看出，文中提出的演算法優於所有基於內核的方法，以及在排序Coulomb矩陣上訓練的MLP演算法。只有基於隨機Coulomb矩陣訓練的MLP才能獲得更優的效果。然而，對隨機排列的充分抽樣隨著N呈指數增長，因此這種方法不太可能在大的數據上進行擴展。

表2

結論

這篇論文介紹了球形CNN，並在兩個重要的學習問題上對提出演算法進行了評測。此外，文中定義了S2和SO（3）的互相關，並分析了它們的屬性，進而實現了一個通用的RRT相關演算法。實驗的數值結果證實了該演算法的穩定性和準確性，即使在深度網路上依然有效。此外，我們已經證明了在不需要對特徵和模型調優有很高要求的情況下，球形CNN可以有效地推廣到整個旋轉過程中，並在三維模型識別和分子能量回歸方面取得接近最先進的結果。

對於類似3D模型識別這種三維任務，我們相信可以通過將SO3擴展到roto-平移組SE3來實現進一步的改進。球形CNN的發展是朝著這個方向邁出的重要的第一步。也許，這個球形的CNN重要的應用場景是對全方位視覺問題的處理。儘管目前在公共資料庫中，全向圖像數據非常少，但在無人機、機器人和自動駕駛汽車中，全方位感測器的普及使這項工作具有非凡的意義。

在非固定和競爭環境中通過元學習進行持續性適應

在非平穩環境中不斷學習和適應有限經驗的能力是計算機通往真正的人工智慧的重要里程碑。此文提出了「learning to learn」框架的持續性適應問題。通過設計一種基於梯度的元學習演算法來對動態變化和對抗性場景的進行適應。此外，文中還設計了一種基於多智能體（multi-agent）的競爭環境：RoboSumo，並定義了適應性迭代遊戲，用於從不同方面測試系統的持續適應性能。實驗證明，元學習比在few-shot狀態下的反應基線具有更強的適應能力，且適應於進行multi-agent學習和競爭。

實驗中使用了三種模型作為智能體（agent），如圖1（a）所示。它們在解剖學上存在差異：腿的數量，位置，以及對大腿和膝關節的限制。圖1（b）表示非平穩運動環境。應用於紅顏色的腿的扭矩是由一個動態變化的因素決定的。(c)用於表示 RoboSumo競爭環境。

圖1

實驗結果：

下圖表示在一輪包含多局的迭代適應遊戲中，一個agent與其對手競爭。如果它在一輪中贏了多局（用顏色來表明勝敗），那麼它就贏了一局。agent和他們的對手可以在不斷地改變策略。

圖2

2. 在迭代遊戲中，輪數和從對手學習到的結果如圖3所示，從圖中可以看出，當每一輪的迭代次數超過50次時，通過技術追蹤的適應問題就變成了「測試的同時進行學習」的問題，除此之外，它可以與一些訓練時從未見過的對手進行競爭。在few-shot和標準兩種學習制度下，元學適應策略的執行結果幾乎都是相同的。這表明，元學習策略在訓練時可以學到一種特殊的偏置，使它能夠從有限的經驗中表現得更好，但也限制了它利用更多數據的能力。

圖3

（本文首發於新智元微信公眾號：AI_era，歡迎關注！）