如何理解卷積,另外如何理解圖像處理中的卷積?
一直不能理解這種運算的意義是什麼,求指點誒~
對於圖像而言,離散卷積的計算過程是模板翻轉,然後在原圖像上滑動模板,把對應位置上的元素相乘後加起來,得到最終的結果。如果不考慮翻轉,這個滑動-相乘-疊加的過程就是相關操作。事實上我也一直用相關來理解卷積。在時域內可以從兩個角度來理解這樣做的含義。
一種是濾波,比如最簡單的高斯模板,就是把模板內像素乘以不同的權值然後加起來作為模板的中心像素值,如果模板取值全為1,就是滑動平均;如果模板取值為高斯,就是加權滑動平均,權重是中間高,四周低,在頻率上理解就是低通濾波器;如果模板取值為一些邊緣檢測的模板,結果就是模板左邊的像素減右邊的像素,或者右邊的減左邊的,得到的就是圖像梯度,方向不同代表不同方向的邊緣;
另一種理解是投影,因為當前模板內部圖像和模板的相乘累加操作就是圖像局部patch和模板的內積操作,如果把patch和模板拉直,拉直的向量看成是向量空間中的向量,那麼這個過程就是patch向模板方向上的投影,一幅圖像和一個模板卷積,得到的結果就是圖像各個patch在這個方向上的response map或者feature map;如果這樣的模板有一組,我們可以把這一組看成一組基,得到的一組feature map就是原圖像在這組基上的投影。常見的如用一組Garbor濾波器提取圖像的特徵,以及卷積神經網路中的第一層,圖像在各個卷積核上的投影。從信號與系統的角度講卷積是線性時不變系統才有的運算
具體推導是先將輸入信號按基函數展開,然後利用線性時不變特性得到輸出信號為輸入信號與系統單位衝激響應的卷積。
兩個信號的卷積是把一個信號當成系統衝激響應來推演。離散和二維情況都可以類似推導。 這個解釋物理上不是很直觀,但從數學角度看是比較嚴格且容易接受的。
此外,順便再對線性時不變性以及因果性做一些說明。可以看到所謂線性系統是指輸出是輸入信號及其延時的線性疊加,可以把看成對的貢獻因子。所以如果出現有等對輸出貢獻,則必然不是線性系統了; 而如果貢獻因子(加權因子)與有關則必然不是時不變系統。 顯然描述卷積的式子中不存在上述問題。
所謂因果系統是指時刻輸出僅與時刻及其以前時刻的輸入有關, 因此上面卷積的式子中也即時的貢獻因子必須為0,也即,因果系統必須保證
理解成加權平均就好了
卷積是基於線性時不變系統的,當輸入為在零時刻為一其他時刻為零(暫且記做δ(t))時,輸出為h(t)。任意輸入x(t)可以分解為無窮個k倍的δ(t+t0)相加,那麼,由時不變性,輸入δ(t+t0)輸出h(t+t0),由線性,輸入為kδ(t+t0)相加,輸出為kh(t+t0)相加。這就是卷積要做的事情,我們大家常見的卷積公式x(t)*h(t)=∫x(τ)h(t-τ)dτ不就是把輸入x分解為∫x(τ)δ(t-τ)dτ,對應的輸出為∫x(τ)h(t-τ)dτ。
所以說,卷積是由輸入以及輸入為δ(t)時的輸出h(t)(單位衝激響應)得出輸出的一種運算,當然前提是系統為線性時不變的。h(t)就決定了系統的全部性質。
在頻域上,卷積變乘積。
首先,信號如exp(st)有個很好的性質,那就是它經過線性時不變系統的輸出為H(s)·exp(st),其中H(s)=∫h(t)exp(-st),為什麼呢,可以證明exp(st)*h(t)=∫h(τ)exp(s(t-τ))dτ=exp(st)∫h(τ)exp(-sτ)dτ= exp(st) H(s)
。
然後我們考慮任意信號x(t)可以分解為∫X(s)exp(st)ds(其實這就是傅里葉逆變換做的工作啊,傅里葉逆變換就是信號的分解,然後這個『任意』不準確,應該是滿足迪里科里條件,但是不深究的話也可以,不影響理解)。
同樣的, x(t)進入線性時不變系統,輸出是什麼?利用線性可以得出,輸出=∫X(s)H(s)exp(st)ds。
也就是說,輸入到輸出,對應不同的exp(st),係數由X(s)變為X(s)H(s)這就是卷積變乘積了。
其實大家把s換成jw就是傅里葉變換了。
其實δ(t-t0)跟exp(st)都是對信號的分解,然後利用系統的線性時不變性推出輸出信號, δ(t-t0)這個分解更簡單明顯,但是計算輸出要用到卷積,而 exp(st)分解則是傅里葉的重大貢獻,不像 δ(t-t0)那麼直觀,但它的輸出計算則是乘法運算了,而且輸出仍為 exp(st)的形式只是係數乘了個H(s),因此這種分解方式也是有很大好處的。
把圖像信號理解為一個隨機變數X(2維的),把卷積核理解為另一個隨機變數Y(也是2維的),卷積可以理解為隨機變數和的分布,即,X+Y的分布。
卷積是內積的一種特殊形式,從內積的角度出發,就好理解了。
我現在只學習了信號處理方面的卷積,圖像處理方面我只能推測。
來看信號處理中如何出現卷積的。假設B是一個系統,其t時刻的輸入為x(t),輸出為y(t),系統的響應函數為h(t),按理說,輸出與輸入的關係應該為
Y(t)=h(t)x(t),
然而,實際的情況是,系統的輸出不僅與系統在t時刻的響應有關,還與它在t時刻之前的響應有關,不過系統有個衰減過程,所以t1(&
卷積是人為定義的一種運算,就是為了計算的方便規定的一種演算法。兩個函數普通乘積的積分變換(傅里葉變換與拉普拉斯變換)與這兩個函數積分變換的卷積建立了關係,使我們只要會求兩個函數的變換,利用卷積就可以求這兩個函數乘積的變換。
卷積在數據處理中用來平滑,卷積有平滑效應和展寬效應. (我感覺在圖像圖像處理方面有平滑作用吧)
看到有回答已經說過了鵪鶉:如何理解卷積,另外如何理解圖像處理中的卷積?
言簡意賅,一語中的。
所以我認為,卷積的本質是
提取圖像不同頻段的特徵
具體可以移步本人拙作,偏科普性質 [CV] 通俗理解『卷積』——從傅里葉變換到濾波器
就像拿著放大鏡看書,卷積核就是放大鏡,原信號就是書
一個單位脈衝信號,經過一個卷積核,得到的結果,就是這個卷積核。
一個圖像是一個不同幅度的脈衝信號的n*m陣列,經過一個卷積核,得到的結果,就是個經過n*m個不同幅度的平移後的卷積核的疊加。
例如,高斯模糊,可以認為是將n*m個高斯核給疊加起來了。那麼這個圖像就是由高斯核表達的。細節信息被衰減了,是因為高斯核無法表達細節。(這樣說不準確,求指正)
例如,gabor濾波,可以認為是將n*m個紋理塊疊加起來了,那麼這個圖像就是由一種紋理塊表達的。平滑部分被衰減了,是因為紋理塊無法表達平滑部分。(這樣說不知道對不對,求指正,高頻的正弦信號可以表達直流信號嗎?好像不可以吧)
所以,是不是可以認為,卷積主要描述線性濾波。比如鏡片造成的模糊、視覺中感受方向的細胞。
高票答案中用投影解釋卷積,挺形象的,其實線性濾波就是投影、基底變換?我猜是濾波吧。
空域卷積相當於FFT域的乘積忘的差不多了,不過好像一維二維都是相同的:我想在頻域做乘法,對應到時域是什麼運算?這個運算就叫卷積。
印象中卷積本身沒有什麼意思-----除了多項式相乘,沒有見過單獨為了使用卷積而使用卷積的。
開始從多項式的卷積去理解比較靠譜,其實就是把同類項的係數相加。計算過程就是反褶→平移→相乘→相加
席捲地積累起來,積是積分的意思
這個問題下應該大部分都是學電或者機電的答題者
但是我想從機械振動方面回答下這個問題
考慮有一個單質量振動系統,M是質量,K是彈簧彈性係數,C是阻尼
那麼應該得到縱向的力平衡式
根據高數,我們知道這個方程應該應該有兩個解,通解和特解。通解不用多說,關鍵在於特解。
對於非周期性激勵的解法有兩種,其中之一就是卷積
現在先不管原來的激勵
考慮有一個脈衝信號(狄克拉函數),只在該瞬間作用,之後為自由振動
(如圖a),脈衝作用後會使
根據歐拉祖傳的微分方程解法
將代入到式(自由振動)
則有
我們將稱為原方程的特徵多項式,根據這個多項式解得一對帶負實部的共軛復根和。得到
現在引入條件
解得和
這樣就得到了函數(忘記了叫什麼TAT),它表示了系統特徵,即受到一個脈衝激勵之後自由振動輸出的響應。
現在回到原問題,如果我們將的每一個瞬時輸入都當作一個脈衝激勵,並且疊加之前系統的狀態,則可以求得在激勵下的響應。
卷積的構成可以這樣理解
先將看作一系列幅值不同的脈衝信號
脈衝的強度由其面積確定,所以在任意處,有一個大小為的脈衝,並且它對應的響應是,因為在處輸入脈衝後,只剩下的時間供其自由振動。
最後將所有的位移全部疊加在一起,得到
再取極限
推薦閱讀:
※哪裡可以找到比較全的關於processing代碼的解釋?
※如何製作有噪點的背景畫面?
※水下攝影如何調出通透的感覺?
※使用電腦進行圖像處理(視頻、照片、繪圖、設計)工作,顯示器色彩空間為何不能統一?怎麼解決?
※色度圖的問題