計算機視覺的前沿理論有哪些?


題主要問的是有關機器視覺的理論還是前沿方向呢?

1. 關於視覺的理論:由於計算機視覺是一個偏工程的研究方向,因此視覺的理論一直不是很成熟。不過還是有一些大牛的組在研究啦,比如UCLA的Center for Vision, Cognition, Learning, and Art (VCLA) ,他們就研究一些基礎的視覺理論問題,比如:Information Scaling Theory,PAC-learning in vision,Analogic learning等。

2. 話說了解計算機視覺的前沿方向,最好的辦法就是關注計算機視覺或模式識別方面的國際頂級會議,e.g.,ICCV, ECCV and CVPR(視覺三大頂級會議)。其實CV的會議有個特點是oral的paper數量佔總錄用文章很小的比例,一般oral錄用率僅為5%左右。在這些鳳毛麟角的paper中,我們就可以很清晰的看到視覺最新的熱點。

以ICCV2013中oral paper為例(ICCV 2013 papers on the web):

3D computer vision:5篇;

Computational photography, sensing and display:2篇;

Face and gesture:1篇;

Low-level vision and image processing:4篇;

Motion and tracking:6篇;

Optimization methods:4篇;

Performance evaluation:1篇;

Physics-based vision and Shape-from-X:2篇;

Recognition: detection, categorization, classification, indexing, matching:14篇;

Segmentation, grouping and shape representation:2篇。

很清晰的就可以看出來熱點仍然是Recognition, 3D vision and Tracking(btw: 低層特徵low-level vision近幾年由於deep learning的出現已經快變成明日黃花了)


感覺這個問題拆開來講可能更好一點

關於前沿

任何一個方面,只要能使計算機接近甚至達到人眼視覺的水平,就是這個領域的前沿。

雖然說計算機視覺技術在一些應用領域如產品缺陷檢測,條形碼掃描等已經有大規模的商業應用,但是在更普遍的視覺應用上,離人眼視覺的水平還相去甚遠。這也是該領域充滿機遇與挑戰,研究十分活躍的原因。

關於理論

感覺計算機視覺是以應用為導向的研究領域,常用的基礎理論涉及立體幾何,線性代數,優化,統計學,信號處理(包括圖像處理),基本都是拿已有的理論去解決具體問題,包括

3D重建(3D reconstruction),相機校正(camera calibration),姿態估計(pose estimation),目標識別(object recognition),運動分析(motion analysis)都是比較經典的問題,也一直以來是計算機視覺活躍的研究領域。以應用為導向的研究雖然也會有發展出相應的理論,但應該說還是有別於我們常說的基礎理論吧。

計算機視覺借鑒相關學科理論的一個很好的例子是利用深度學習(deep learning)的理論框架進行目標識別,最新的成果,基於卷積神經網路(Convolutional Neural Network)演算法的人臉識別率已經能達到接近人工識別的水平。

其他正在興起的研究課題還有眼動追蹤(eye gaze tracking),顯著度檢測( saliency detection)等。

補充:

1. 想了解計算機視覺可以做什麼,不妨看看OpenCV,這個著名的c++開源庫實現的了眾多計算機視覺常用的功能

2. 關於深度學習,其實也是一個早就有的想法,只是到了最近幾年在演算法實現上有了突破(參考Geoffrey Hinton在Nature上的文章),才開始重新變得熱門


計算機視覺現在比較火的方向可能就是visual object recognition了。現在關於語義的方向都很熱,姿勢識別,瞳孔跟蹤,表情識別等等。跟蹤,分割,顯著性區域檢測傳統方向也一直在top level 的期刊和會議上也有較高的比例。這是2013年CVPR文章的統計數據。

ICCV 2013 Results (29 Aug, 2013)


死灰復燃的上古神器,包治百病,買不了吃虧買不了上當,ML神油,CV大力丸......

deep learning


用能量優化的方法解決計算機視覺,成為一種常用方法,最近的視覺問題:比如ECCV 2014 best paper利用目標的從屬關係和互斥關係研究目標識別,ACCV 2014 best paper 同時估計圖的結構和label.


個人感覺計算機視覺一直來說比較難的都是2D的segmentation,最近比較流行的是semantic segmentation,還有比較火的方向是large scale的image retrieval,deep learning是其中一個比較好的解決方案,其他的還有很多跟Depth攝像機相關的研究,比如pose estimation,action recognition等。就計算機視覺這個學科來看,其實還有很大發展空間,幾乎所有正在研究的方向都可以稱為前沿


推薦閱讀:

有哪些有趣的圖形學(CG)和計算機視覺(CV)相結合的應用的例子?
計算機視覺中,目前有哪些成熟的匹配定位演算法?
人工智慧未來會最先在哪個領域實現應用?
如何通過人工神經網路實現圖像識別?
單目SLAM在移動端應用的實現難點有哪些?

TAG:計算機 | 計算機視覺 | 計算機前沿 |