3D卷積神經網路Note01
02-13
今年深入研究深度圖像處理,最近正好發現3D卷積神經網路,感覺這個可能會是個不錯的新的研究方向。做下總結......
首先,近年來已經出現了一些相應的研究,文末會給出引用。
關於CNN不做筆記,網上相應講解很多。
這裡針對圖像識別領域的3D卷積神經網路做些筆記和總結討論。仍在學習中......
CNN的強大毋庸置疑,但是目前是以2D為輸入,圖像識別領域也就是以RGB圖像輸入。然而近年行為動作的識別以及深度感測器的普及,出現了一些3D CNN模型的研究。比較突出的有TPAMI2013關於人體行為的識別和CVPR2015的基於3D卷積神經網路的手勢識別。
3D CNN architecture [1] 3D CNN architecture [2]3D CNN模型的主要特性有:
1)通過3D卷積操作核去提取數據的時間和空間特徵,在CNN的卷積層使用3D卷積。
2)3D CNN模型可以同時處理多幅圖片,達到附加信息的提取。
3)融合時空域的預測。
繼續學習......
References:
[1] SJi, MYang, and KYu. 3D convolutional neural networks for human action recognition. IEEE Transactions on Pattern Analysis & Machine Intelligence, 35(1):221–231, 2013.
[2] Pavlo Molchanov, Shalini Gupta, Kihwan Kim, Jan Kautz, and Santa Clara. Hand Gesture Recognition with 3D Convolutional Neural Networks.pages 1–7, 2015.
推薦閱讀: