有哪些好看的CNN模型畫法?

主要是論文中使用的。看上去精簡的。


謝邀。第一次答DL相關題目,如有錯誤,歡迎指正。

前幾天剛好跟同學討論到畫的好看的CNN圖,正好答一下問題,自己也做下整理收藏。

說起CNN的模型圖,要從經典CNN的相關paper開始:

LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。

依次上圖(多圖預警):

LeNet

AlexNet

ZF-net

NIN

GoogLeNet

VGG

Batch Norm

通用數據預處理,沒有提出新的網路模型

InceptionV3

ResNet

InceptionV4

在經典的CNN基礎上,大家都會根據自己的演算法和結構作出一些改進。

個人認為比較好看的CNN結構圖:

Andrej Karpathy大神主頁(Andrej Karpathy Academic Website)貼出了部分論文的圖:

Large-Scale Video Classification with Convolutional Neural Networks paper里橫向類似Alexnet的圖以及縱向多個level的fusion圖,與之類似的是另一篇paper裡面為了表示各種level pooling做的層級concat的圖:

Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的圖。

Two-Stream Convolutional Networks for Action Recognition in Videos視頻分析經典的Two-stream CNN圖:

同樣視頻分析Limin Wang做了不同改進的視頻應用CNN結構圖:Limin Wang

最後放一個我們Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition裡面的圖:

個人理解和簡單總結

根據上面一些經典的CNN結構圖和大神們paper裡面的CNN模型圖,可以看出大家還是在參考經典CNN結構的基礎上作出自己的一些變化:例如Cold Start paper模仿ZF-net的圖,我們Pooling the Convolutional paper和視頻分析的很多paper參考Two-Stream的圖,在layer上面進行Fusion以及Pooling通常會參考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation類似的圖。

當然除了直接放圖之外,VGG還放出了一個表格,清晰的表明每一層的結構和參數。有時候,為了強調自己模型在網路局部的改進,也會有局部區域圖出現例如InceptionVX裡面卷積核大小不斷變化的一系列圖,ResNet中shorcut結構:


前兩天看到一個高端的。


推薦閱讀:

如何比較PixelCNN與DCGAN兩種Image generation方法?
[DL-架構-ResNet系] 007 SENet
從編程實現角度學習Faster R-CNN(附極簡實現)
PhD Talk直播預告 | 亞馬遜高級應用科學家熊元駿:人類行為理解研究進展
CS231n課程筆記翻譯:圖像分類筆記(上)

TAG:計算機視覺 | 深度學習DeepLearning | 卷積神經網路CNN |