如何理解卷積神經網路中的卷積?

看到ufldl的教程中說的是,用從8*8樣本中所學習到的特徵和原有圖像做卷積,從而對原來圖像上的統一位置獲得一個不同特徵的激活值。不知道卷積的具體過程是怎樣的?望有知道的可以幫忙講解一下,謝謝。印象中的卷積是 移位 相乘再相加,不知道卷積神經網路中的卷積是什麼步驟?


一維離散數據卷積公式為:

c(n)=a(n)*b(n)=sum_{i=-infty}^{infty}a(i)b(n-i)

其數學本質為兩段序列翻轉移位相乘(如果兩段序列不翻轉就相乘則為相關係數,如果兩段序列不翻轉移位相乘則為相關函數)。

同理,二維數據卷積公式為:

c(n_1,n_2)=sum_{k_1=-infty}^{infty}sum_{k_2=-infty}^{infty}a(k_1,k_2)b(n_1-k_1,n_2-k_2)

數學本質是一個矩陣翻轉後和另一個矩陣移位相乘

下面就看一下「從8*8樣本中所學習到的特徵和原有圖像做卷積」的含義是什麼。ufldl給出的Convolved features 說明圖如下:

第一步:

第二步:

第三步:

第四步:

……………………………………………………

最後一步:

好,這個圖對於UFLDL中的Convolved操作說的很清楚。那麼這個操作和二維數據卷積的關係是什麼呢?

上面已經給出卷積的本質是翻轉移位相乘

1,可以看出上述Convolved feature為一個矩陣和另一個矩陣的移位相乘,但是並沒有翻轉。2,所以只需把某一個矩陣(比如比較小的那個矩陣,那個比較小的那個矩陣就是你說的學習到的特徵)翻轉之後,在和原圖做卷積操作,則就相當於使用不翻轉的特徵做移位相乘操作,即Convolved feature。

這就是ufldl所說的得到卷積特徵的含義。


這裡有一個比較通俗易懂的介紹例子,關於卷積神經網路識別字母 X 和 O 的:

[How Convolutional Neural Networks work](https://www.youtube.com/watch?v=FmpDIaiMIeA)

(需要翻牆)


推薦閱讀:

能否利用神經網路對低質量音頻進行優化?
如何理解 AlphaGo 2.0 所用的殘差網路?它是怎樣一種神經網路?有哪些優點缺點?
神經翻譯?
哪位高手能解釋一下卷積神經網路的卷積核?
如何作用和理解神經網路在電力電子方向的運用?

TAG:神經網路 | 卷積 | 深度學習DeepLearning |