機器視覺需要學習哪些數學知識?
本科機械,研究生機器視覺,了解到CV(MV)對數學要求比較高,想提前學習一下相關的知識,那麼有哪些數學知識對機器學習比較重要呢?
有推薦的網路課程或者資料書籍嘛?最好可以按照學習順序、學習程度和學習時間分階段介紹一下~
謝邀。
數學基礎一定是線性代數啊。
學通這本線代基礎,搞CV應用應該沒啥壓力了,記得有相應的MIT公開課錄像。然後推薦這本數字圖像處理,對上手各種圖像處理都非常有幫助。
然後再讀這本專門針對CV的。
這三本看完,經典的CV基本就遊刃有餘了。別的熱門教材應該也不差多少。
更高級的應用就得去翻paper了。說實話,這些東西我覺得上課基本沒用,唯一的好處就是會選一些不錯的題目,逼我這種不自覺的人做作業。
硬要說別的好處,就是老師會普及一些書上沒用的新的熱門演算法應用等等,省下不少時間。關鍵還是要親自操作。
基於CNN的MV沒學過沒用過,沒法給意見。如果題主有些machine learning的基礎,估計找些案例為主的教材照做,應該也比較容易上手。
簡單的輪子自己再造一遍加深理解。複雜的輪子都是人家一伙人讀三五年PhD造出來的,你再造一遍純粹浪費時間,能拿來用就拿來用。機器視覺和計算機視覺的智能化還有所區別。現在機器視覺在工業上的應用主要就是視覺引導機器人、2D及3D測量,以及缺陷檢測。前兩者需要的根本是攝像頭標定。這其中運用到了線性代數、線性優化和三維幾何的知識。最後一種可能會用到形態學處理,也就是數字圖像處理的知識,而數字圖像處理的基礎就是線性代數。
除了 @野合菌 所說的,我還推薦可以學學:
Multi-View GeometryRobotics Vision and ControlVision Guide Robot是未來的主流,相信你這個專業也是朝這個方向做的。
本人在美帝某機器視覺行業龍頭公司從事研發。
首先注意 機器視覺 和 計算機視覺 還是有一定區別的。機器視覺是一個子類,它的應用領域多為工業自動化、工業檢測領域應用。對環境可控、光照有要求。要求演算法和設備緊密結合。理論方面:線性代數、坐標變換、立體幾何、優化、信號處理、圖像處理硬體方面:工業相機、鏡頭、光學、各類機械臂及linear stage軟體:C、C++,數據結構、嵌入式編程、代碼優化如果是CV計算機視覺的話要學的就多很多了,概率統計機器學習人工智慧什麼的都得上了。推薦岡薩雷斯的數字圖像處理。經典中的經典。
格外注意傅立葉。空域的卷積等於頻域的乘積。這句話簡直是caffe的基本思想。機器學習 Bishop那本經典。當然也有斯坦福大神的公開課。
再提一下女神飛飛李的公開課。也是不錯的學習資料。
勿將高台築壘土。很多基礎知識都要補吧。C++ PrimerOpenCv文檔圖形學的東西 OpenGL紅色那本編程指南。計算幾何其實用不太到。不說多了直接上圖,計算機視覺必看!
機器視覺涉及範圍比較廣,軟體、硬體都應該學習,推薦給網站www.vision263.com,可以了解學習機器視覺應該等相關內容。
機器視覺主要是指計算機來實現人的視覺功能,也就是用計算機來實現對客觀的三維世界的識別。機器人要對外部世界的信息進行感知,就要依靠各種感測器,就好比人類一樣,在機器人的眾多感知感測器中,視覺系統提供了大部分機器人所需的外部信息。
依據視覺感測器的數量和特性,目前主流的移動機器人視覺系統有單目視覺、雙目立體視覺、多目視覺和全景視覺。
至於說所需要的數學知識,矩陣論、離散數學、歐式幾乎等,在數學的學科前沿都有介紹,機器視覺是人工智慧的一個研究領域,人工智慧是未來的希望,希望在此之前,先對人工智慧有一個整體的認知,一定要明白,人工智慧時代的研究熱點是什麼,主要應用領域是什麼? - 人工智慧 多智時代
剛剛知道了導師的研究方向,現在一臉懵逼。。
關注微信公眾號:機器視覺專業論壇,裡面文章很多
線代。優化。
推薦閱讀:
※圖像金字塔除了sift演算法之外還有什麼應用?
※ICCV2015 有什麼值得關注的亮點?
※模式識別中從Kernel方法的本質來看,是否真的有效?
※Amazon Fire Phone 的 Firefly 識別功能是怎麼工作的?