機器視覺需要學習哪些數學知識?

本科機械,研究生機器視覺,了解到CV(MV)對數學要求比較高,想提前學習一下相關的知識,那麼有哪些數學知識對機器學習比較重要呢?

有推薦的網路課程或者資料書籍嘛?最好可以按照學習順序、學習程度和學習時間分階段介紹一下~


謝邀。

數學基礎一定是線性代數啊。

學通這本線代基礎,搞CV應用應該沒啥壓力了,記得有相應的MIT公開課錄像。

然後推薦這本數字圖像處理,對上手各種圖像處理都非常有幫助。

然後再讀這本專門針對CV的。

這三本看完,經典的CV基本就遊刃有餘了。別的熱門教材應該也不差多少。

更高級的應用就得去翻paper了。

說實話,這些東西我覺得上課基本沒用,唯一的好處就是會選一些不錯的題目,逼我這種不自覺的人做作業。

硬要說別的好處,就是老師會普及一些書上沒用的新的熱門演算法應用等等,省下不少時間。

關鍵還是要親自操作。

基於CNN的MV沒學過沒用過,沒法給意見。如果題主有些machine learning的基礎,估計找些案例為主的教材照做,應該也比較容易上手。

簡單的輪子自己再造一遍加深理解。

複雜的輪子都是人家一伙人讀三五年PhD造出來的,你再造一遍純粹浪費時間,能拿來用就拿來用。


機器視覺和計算機視覺的智能化還有所區別。現在機器視覺在工業上的應用主要就是視覺引導機器人、2D及3D測量,以及缺陷檢測。前兩者需要的根本是攝像頭標定。這其中運用到了線性代數、線性優化和三維幾何的知識。最後一種可能會用到形態學處理,也就是數字圖像處理的知識,而數字圖像處理的基礎就是線性代數。

除了 @野合菌 所說的,我還推薦可以學學:

Multi-View Geometry

Robotics Vision and Control

Vision Guide Robot是未來的主流,相信你這個專業也是朝這個方向做的。


本人在美帝某機器視覺行業龍頭公司從事研發。

首先注意 機器視覺 和 計算機視覺 還是有一定區別的。機器視覺是一個子類,它的應用領域多為工業自動化、工業檢測領域應用。對環境可控、光照有要求。要求演算法和設備緊密結合。

理論方面:線性代數、坐標變換、立體幾何、優化、信號處理、圖像處理

硬體方面:工業相機、鏡頭、光學、各類機械臂及linear stage

軟體:C、C++,數據結構、嵌入式編程、代碼優化

如果是CV計算機視覺的話要學的就多很多了,概率統計機器學習人工智慧什麼的都得上了。


推薦岡薩雷斯的數字圖像處理。經典中的經典。

格外注意傅立葉。空域的卷積等於頻域的乘積。這句話簡直是caffe的基本思想。

機器學習 Bishop那本經典。當然也有斯坦福大神的公開課。

再提一下女神飛飛李的公開課。也是不錯的學習資料。

勿將高台築壘土。很多基礎知識都要補吧。

C++ Primer

OpenCv文檔

圖形學的東西 OpenGL紅色那本編程指南。

計算幾何其實用不太到。


不說多了直接上圖,計算機視覺必看!


機器視覺涉及範圍比較廣,軟體、硬體都應該學習,推薦給網站www.vision263.com,可以了解學習機器視覺應該等相關內容。


機器視覺主要是指計算機來實現人的視覺功能,也就是用計算機來實現對客觀的三維世界的識別。機器人要對外部世界的信息進行感知,就要依靠各種感測器,就好比人類一樣,在機器人的眾多感知感測器中,視覺系統提供了大部分機器人所需的外部信息。

依據視覺感測器的數量和特性,目前主流的移動機器人視覺系統有單目視覺、雙目立體視覺、多目視覺和全景視覺。

至於說所需要的數學知識,矩陣論、離散數學、歐式幾乎等,在數學的學科前沿都有介紹,機器視覺是人工智慧的一個研究領域,人工智慧是未來的希望,希望在此之前,先對人工智慧有一個整體的認知,一定要明白,人工智慧時代的研究熱點是什麼,主要應用領域是什麼? - 人工智慧 多智時代


剛剛知道了導師的研究方向,現在一臉懵逼。。


關注微信公眾號:機器視覺專業論壇,裡面文章很多


線代。優化。


推薦閱讀:

圖像金字塔除了sift演算法之外還有什麼應用?
ICCV2015 有什麼值得關注的亮點?
模式識別中從Kernel方法的本質來看,是否真的有效?
Amazon Fire Phone 的 Firefly 識別功能是怎麼工作的?

TAG:圖像處理 | 模式識別 | 計算機視覺 | 機器視覺 |