數字圖像處理處理中的數學怎麼提高?

各位大大好,最近在做圖像檢索方面的研究。發現很多數字圖象處理需要很多數學,比如最近再看的SIFT特徵提取,涉及到了大量的數學,而且個人感覺很難,基本看不懂。感覺急需補充數學知識,但是看數圖上面涉及到的數學也是包含各個領域,所以不知道如何下手,還請各位大大指條路?目前擁有高等數學,線性代數,數理統計,概率論的本科數學基礎。


不要研究純數學,不要花時間研究數學證明,不要做數學上的習題,不要解偏怪難問題

只理解通法通則,只關心實際用途。

對科研而言,知道什麼問題可解什麼問題不可解,可解的問題大概要用到什麼數學知識,要比具體解這個問題來的重要得多。

比如凸優化,知道什麼樣的函數和約束條件可以做凸優化,什麼樣的函數能轉換為凸優化可解的問題,比具體如何做凸優化重要幾百萬倍。

抓框架,放細節,讓數學成為你科研的「靈機一動」,這就夠了。

至於深入研究,書到用時方能讀。

不以應用為目的而純以「打一個牢固的基礎」為目的的學習,大概有如下兩個特徵:

1.容易煩,學不下去。

2.好不容易學下去了,然後全部忘光了。

別干這種傻事,真的。

推薦的研究路數是,掌握基本的數學知識(以知道論文里的數學名詞含義為準)後,選擇一個研究方向,看論文。看的過程中如果發現某個論文必須有某個數學背景才能理解,就快速的去補一下,然後繼續看,然後你就會發現,你既跟上了研究的步伐,數學水平(的廣度)又有了很大提高,而且學到的東西都比較牢固。

真去一本本仔細研究排名第一的回答提到的那幾本書,那你就傻了。


矩陣論(奇異值分解),概率論,線性代數(特徵值,特徵向量),隨機信號(snr),貝葉斯樸素理論,傅里葉函數,馬爾可夫隨機場,稀疏編碼,最優化方法,暫時想到這些。


利益相關者,特來回答。

推薦你看一下《圖像處理中的數學修鍊》一書(清華大學出版社出版)。

關於書籍內容的一些介紹可以參考:(圖像處理中的數學原理詳解(Part1 總綱)),以作為是否適合自己需求的一個評判。


作為工程師,數學了解一下幹啥用的就好,計算交給Matlab。


做圖像檢索一般還停留在演算法的使用層面吧,沒有很多地涉及到演算法原理部分。

很多數字圖象處理演算法都已經有比較成熟的C或者matlab代碼和LIB庫,如果僅僅用來使用的話,一般都能找到。

很多開源的數字圖像處理庫每年都會更新最新的演算法,例如問題里提到的SIFT運算元,在2013年版本的opencv里應該就有可以直接調用的介面了。

Matlab也會把一些經典的數學模型做成可以調用的函數,有時簡單到只要輸入參數就能得到結果。

當然這是一種比較投機取巧的辦法,如果你想深入鑽研演算法本身,還是需要紮實的數學底子,高數、概率論、隨機過程什麼的,另外現在流行用機器學習來解決很多問題,所以關於模式識別、神經網路的知識也可以看一些。

【天哪我一數學渣居然敢回答這個問題,不過看了一眼自己寫的。。。。果然還是教人如何投機取巧的。。那麼。。如果不想像答主一樣變成數學渣的話。。還是老老實實鑽研數學吧。


矩陣理論、凸優化

這兩個必備


SIFT特徵提取只是一個以高斯核為基礎的計算機演算法,了解一下這個數學模型,知道他要干哪些事情,有哪些細節性的東西就好了。計算交給Matlab或者opencv都可以。

但是,一定要去掌握一下這個數學模型,不然各個計算參數你都搞不明白,在實際應用中不好用,會出現偏差。數學還是需要的。


加深對矩陣概念的理解


作為電信方面的學生說一下。

僅僅有你那幾個基礎是不夠的。你還需要:複變函數與積分變換,信號與系統→_→


樓下有取巧的手段,也有夯實基礎的手段,怎麼選還是看自己。我說點自己的看法,取巧的手段快速高效的培養了大批的調參玩家,適應了市場上目前數據和圖像領域的火爆求職狀態,學會調用下matlab或者用下幾個庫,就敢說自己懂得數字圖像處理的人太多太多,居然還能找到很不錯的工作。但是,我不知道回答使用matlab的人有沒有對比過誤差函數,也就是matlab提供的庫和自己做輪子之間的精度差別,這個差別,才是真正從事數據和圖像領域的層次差別。我也不建議學習過多的數學,但是基礎層面的數學還是要懂的,工科專業的基礎課我默認你會了,其餘的可以看下我別的答案中推薦的書,祝學祺


從你已經具備的基礎分析,你看不懂的原因很簡單: 你不是電信專業的。

建議學一下 信號與系統 這門課


推薦閱讀:

圖像處理和機器學習有什麼關係?
FPGA工程師的技能樹是怎樣的?
如何理解壓縮感知(compressive sensing)?
圖像降噪和圖像濾波的區別是什麼?
在SIFT和SURF之後,有哪些比較新的且具有一定影響力的自然圖像配准演算法?

TAG:數學 | 圖像處理 | 模式識別 | 計算機視覺 | 圖像檢索 |