是否可把CNN用於一維的信號?

我見到的Convolutional Neural Networks都是用於圖像方面的處理,即輸入是一個2維的矩陣,想知道是否有人把CNN用於一維的向量,例如聲音信號等。


可以。比如 WaveNet, SoundNet 都是。

WaveNet: A Generative Model for Raw Audio | DeepMind

SoundNet: Learning Sound


可以:

Convolution1D

Convolutional Layers - Keras Documentation


可以。以前工作有個項目就是這種情況。


補充一個方法:把1維數據轉換到2維空間,然後使用2維CNN

Convolutional(卷積)的思想就是定義receptive fields,用人話說就是定義遠近的鄰居。

所以我們可以把任何數據的表現形式,定義為當前數據點和它的不同距離的鄰居,就能使用(N維)CNN。例如有工作是吧graph轉化為2維CNN:

參考: M Niepert at el., Learning
Convolutional Neural Networks for Graphs
, ICML 16所以可以定義一維數據(如音符序列)的當前點P_{k}(k是序列上的index):

  • 那麼可以定義P_{k-m}P_{k+m}為第一層鄰居,相當於2維下的直接鄰近點,距離為0像素。

  • 定義[P_{k-2m},P_{k-m}]和[P_{k+m},P_{k+2m}]這兩個區間位第二層鄰居,相當於2維下的距離為1像素的的點。

  • 需要的話,還可以繼續定義第三層到第N層到鄰居

最後直接用2維CNN


可以,cnn就是濾波器,換到一維當然可以


華為諾亞實驗室有幾篇論文用cnn做文本回答就是一維的cnn,比如 Neural Responding Machine for Short-Text Conversation


可以的

1.轉換到頻域

2.直接做一維的卷積


可以,目前有這方面的研究


推薦閱讀:

如何評價Momenta ImageNet 2017奪冠架構SENet?
deep learning初學該怎麼入門?是要先好好學習神經網路嗎?
如何看待ACL2017 所有掛arxiv但是沒有在提交時註明的paper全部被拒稿?
增強學習(Reinforcement Learning)的幾點迷惑?
為什麼阿里的刷臉支付使用的是face++技術?

TAG:人工智慧 | 機器學習 | 神經網路 | 人工智慧演算法 | 深度學習DeepLearning |