有哪些好看的CNN模型畫法?
主要是論文中使用的。看上去精簡的。
謝邀。第一次答DL相關題目,如有錯誤,歡迎指正。
前幾天剛好跟同學討論到畫的好看的CNN圖,正好答一下問題,自己也做下整理收藏。
說起CNN的模型圖,要從經典CNN的相關paper開始:
LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。
依次上圖(多圖預警):
LeNet
AlexNet
ZF-net
NIN
GoogLeNet
VGG
Batch Norm
通用數據預處理,沒有提出新的網路模型
InceptionV3
ResNet
InceptionV4
在經典的CNN基礎上,大家都會根據自己的演算法和結構作出一些改進。
個人認為比較好看的CNN結構圖:
Andrej Karpathy大神主頁(Andrej Karpathy Academic Website)貼出了部分論文的圖:
Large-Scale Video Classification with Convolutional Neural Networks paper里橫向類似Alexnet的圖以及縱向多個level的fusion圖,與之類似的是另一篇paper裡面為了表示各種level pooling做的層級concat的圖:
Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的圖。
Two-Stream Convolutional Networks for Action Recognition in Videos視頻分析經典的Two-stream CNN圖:
同樣視頻分析Limin Wang做了不同改進的視頻應用CNN結構圖:Limin Wang
最後放一個我們Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition裡面的圖:
個人理解和簡單總結
根據上面一些經典的CNN結構圖和大神們paper裡面的CNN模型圖,可以看出大家還是在參考經典CNN結構的基礎上作出自己的一些變化:例如Cold Start paper模仿ZF-net的圖,我們Pooling the Convolutional paper和視頻分析的很多paper參考Two-Stream的圖,在layer上面進行Fusion以及Pooling通常會參考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation類似的圖。
當然除了直接放圖之外,VGG還放出了一個表格,清晰的表明每一層的結構和參數。有時候,為了強調自己模型在網路局部的改進,也會有局部區域圖出現例如InceptionVX裡面卷積核大小不斷變化的一系列圖,ResNet中shorcut結構:
前兩天看到一個高端的。
推薦閱讀:
※如何比較PixelCNN與DCGAN兩種Image generation方法?
※[DL-架構-ResNet系] 007 SENet
※從編程實現角度學習Faster R-CNN(附極簡實現)
※PhD Talk直播預告 | 亞馬遜高級應用科學家熊元駿:人類行為理解研究進展
※CS231n課程筆記翻譯:圖像分類筆記(上)
TAG:計算機視覺 | 深度學習DeepLearning | 卷積神經網路CNN |