3D卷積神經網路Note01

今年深入研究深度圖像處理,最近正好發現3D卷積神經網路,感覺這個可能會是個不錯的新的研究方向。做下總結......

首先,近年來已經出現了一些相應的研究,文末會給出引用。

關於CNN不做筆記,網上相應講解很多。

這裡針對圖像識別領域的3D卷積神經網路做些筆記和總結討論。仍在學習中......

CNN的強大毋庸置疑,但是目前是以2D為輸入,圖像識別領域也就是以RGB圖像輸入。然而近年行為動作的識別以及深度感測器的普及,出現了一些3D CNN模型的研究。比較突出的有TPAMI2013關於人體行為的識別和CVPR2015的基於3D卷積神經網路的手勢識別。

3D CNN architecture [1]

3D CNN architecture [2]

3D CNN模型的主要特性有:

1)通過3D卷積操作核去提取數據的時間和空間特徵,在CNN的卷積層使用3D卷積。

2)3D CNN模型可以同時處理多幅圖片,達到附加信息的提取。

3)融合時空域的預測。

繼續學習......

References:

[1] SJi, MYang, and KYu. 3D convolutional neural networks for human action recognition. IEEE Transactions on Pattern Analysis & Machine Intelligence, 35(1):221–231, 2013.

[2] Pavlo Molchanov, Shalini Gupta, Kihwan Kim, Jan Kautz, and Santa Clara. Hand Gesture Recognition with 3D Convolutional Neural Networks.pages 1–7, 2015.

推薦閱讀:

TAG:卷積神經網路CNN | 計算機視覺 |