計算機視覺的應用前景如何?可能有哪些不錯的應用?

舉例說說看


月球車、火星車等行星表面巡視器對計算機視覺的應用已經非常成熟。從勇氣、機遇,好奇號,再到我國的玉兔號,無一不將雙目立體視覺作為重建星球表面、路徑規劃的重要手段。


個人感覺這是一個非常有趣的研究方向,但是與實際應用距離甚遠。目前一些簡單的應用場合能適用,但環境相對複雜一點點,基本演算法都失效了。二維情況受到光照、自遮擋、形變等許多因素的困擾,複雜的演算法當然能在一定程度上解決問題,但是實時性等又無法保證,無法產品化;微軟的KINECT技術有望在視覺領域掀起一股浪潮,採用PrimeSense的深度成像技術,但它目前也只在4米左右範圍內有效,期待該技術的突破。

三維視覺的研究已成為發展趨勢,因為二維情況下的信息丟失確實使得一些問題難以解決,神經科學與視覺的結合有可能開闢新的研究方法。

很好的應用,我覺得目前在人機交互方面還是有的,譬如手勢交互,一些公司的產品也實現了一些簡單的操作與控制,GestureTek, Optrima,PrimeSense等。

希望研究著實能解決實際問題,能從實際應用的角度出發,開發優良的演算法,提升技術向產品轉化能力。


造數 - 新一代智能雲爬蟲

【計算機視覺概念】

計算機視覺是人工智慧的一個分支科學,是使用計算機及相關設備對生物視覺的一種模擬,

主要是研究如何使機器「看」,通常是用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理。通過計算機視覺,電腦將處理更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺的主要任務是通過對採集的圖片或者視頻進行處理以獲得相應場景的三維信息。

【計算機視覺細分領域】

機器視覺系統的工作原理是:通過機器視覺產品(即圖像攝取裝置)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統,得到被攝目標的形態信息,根據像素分布和亮度、顏色等信息,轉變成數字化信號;圖像系統對這些信號進行各種運算來抽取目標的特徵,進而根據判別的結果來控制現場的設備動作。

計算機視覺主要分為視頻處理和圖片處理兩個大部分。

目前人計算機視覺的圖片處理方向大致有:

計算機視覺視頻處理的核心是視覺關鍵信息識別,

【計算機視覺發展大事記】

1、計算機視覺始於20世紀50年代的統計模式識別,當時主要集中於分析與識別二維圖像,

如光學字元識別、工件表面、顯微圖片和航空圖片的分析和解釋等。

2、20世紀60年代,人工智慧學者Marvin令學生寫出程序,讓計算機自動「了解」所連接攝像頭的內容,計算機視覺被拉開。1965年,Roberts通過計算機程序從數字圖像中提取出諸如立方體、楔形體、稜柱體等多面體的三維結構,並對物體形狀及物體的空間關係進行描述,開創了以理解三維場景為目的的三維計算機視覺的研究。Roberts對積木世界的創造性研究給人們以極大的啟發,於是人們對積木世界進行了深入的研究,研究的範圍從邊緣的檢測、角點特徵的提取,到線條、平面、曲線等幾何要素分析,一直到圖像明暗、紋理、運動以及成像幾何等,並建立了各種數據結構和推理規則。

3、20世紀70年代中期,麻省理工學院人工智慧實驗室——CSAIL(CSAIL是麻省理工學院最大的實驗室,也是世界著名的計算科學和人工智慧實驗室),正式開設「計算機視覺」(Machine Vision)課程,同時麻省理工學院的實驗室也吸引了國際上許多知名學者參與計算機視覺的理論、演算法、系統設計的研究。1973年,David Marr教授在MIT AI實驗室領導一個以博士生為主體的研究小組,1977年提出了不同於「積木世界」分析方法的計算視覺(computational vision)理論,該理論在80年代成為計算機視覺研究領域中的一個十分重要的理論框架。

4、20世紀80年代中期,計算機視覺獲得了迅速發展,主動視覺理論框架、基於感知特徵群的物體識別理論框架等新概念、新方法、新理論不斷湧現。1999年,Nvidia公司在推銷自己的Geforce 256晶元時,率先提出了GPU概念。GPU是專門為了執行複雜的數學和集合計算而設計的數據處理晶元。它的出現為並列計算奠定了基礎,同時也增長了數據運算處理速度、擴大了數據處理規模。

5、進入21世紀,計算機視覺與計算機圖形學的相互影響日益加深,基於圖像的繪製成為研究熱點。高效求解複雜全局優化問題的演算法得到發展。

【未來計算視覺的發展】

計算機視覺作為人工智慧的基礎技術,在未來的發展趨勢將是與其他技術融合推到創新型行業發展。

1、汽車駕駛方面。

20世紀70年代開始,美國、英國、德國等發達國家開始進行無人駕駛汽車的研究,在可行性和實用化方面都取得了突破性的進展。中國從20世紀80年代開始進行無人駕駛汽車的研究,國防科技大學在1992年成功研製出中國第一輛真正意義上的無人駕駛汽車。2005年,首輛城市無人駕駛汽車在上海交通大學研製成功。世界上最先進的無人駕駛汽車已經測試行駛近五十萬公里,其中最後八萬公里是在沒有任何人為安全乾預措施下完成的。據湯森路透知識產權與科技最新報告顯示,2010年到 2015年間,與汽車無人駕駛技術相關的發明專利超過22,000件,並且在此過程中,部分企業已嶄露頭角,成為該領域的行業領導者。無人駕駛汽車是智能汽車的一種,也稱為輪式移動機器人,而無人駕駛主要依靠車內的以計算機系統為主的智能駕駛儀來實現無人駕駛的目標,這與計算機視覺是密不可分的。

除了互聯網公司研究的無人駕駛,各大傳統汽車公司如寶馬、奧迪等也在緊羅密布地研究自動駕駛技術,自動駕駛最核心的技術就是汽車裡的電腦通過攝像頭實時產生的圖片和視頻從而學習駕駛,此外行人探測、道路識別、模式識別也都離不開計算機視覺。

2、AR、VR的技術增強。

AR——增強現實技術(Augmented Reality,簡稱 AR),是一種實時地計算攝影機影像的位置及角度並加上相應圖像、視頻、3D模型的技術,這種技術的目標是在屏幕上把虛擬世界套在現實世界並進行互動。

VR是虛擬現實技術的簡稱,是一種可以創建和體驗虛擬世界的計算機模擬系統,它利用計算機生成一種模擬環境,是一種多源信息融合的、互動式的三維動態視景和實體行為的系統模擬使用戶沉浸到該環境中。

計算機視覺是AR VR搭建視覺呈現模型的基礎,提供交互情景交流的核心基礎。VR和AR通常應用在遊戲上,比如前陣大火的Pockman GO等遊戲,但是PS4 的研發團隊說,VR 之所以一開始主要應用在遊戲上,是希望大家通過遊戲來學習 VR 的「互動規律」,讓我們的雙眼、大腦適應適應,之後逐漸應用在了醫療衛生領域。有了VR、AR,醫護人員在學習新技能、練習手術操作時,就能歷史上第一次在一個 「犯了錯誤也不要緊」 的環境下練習,萬一失誤,也不會對患者造成危險。

在這個前提下,VR/AR與醫療的結合將分成三類:

第一類是「做手術」 類;

第二類是「醫師技能訓練」 類;

第三類是「患者康復訓練」 類。

3、更優秀的圖片與視頻處理。無論是各種黑科技的美圖軟體還是各種奇幻的視頻處理,其核心技術都是利用計算機視覺進行的降噪、圖像分割、圖像處理、視頻壓縮。此外,相機中的人臉追蹤,快速對焦,人臉識別無疑不與計算機視覺有關。可以預想得到在未來計算機視覺的幫助下將產生越來越多的「照騙」。


同意樓上所說,感覺計算機視覺領域的技術離實際應用越來越近了。Kinect是一例,未來在AR(Augmented Reality)領域應該會有大規模應用。


機器視覺近些年應用已經越來越成熟,從日常超市條形碼檢測、上下班指紋考勤、人臉識別考勤、 高速路車牌識別、航空遙感測控地形地貌、電影特效製作、工業生產自動化檢測、 醫學影像檢測,再到航空天文領域等,應用都已經逐漸成熟。

小女曾經從事機器視覺演算法研發三年,主要針對工業領域視覺運用的演算法,主要的應用有各種工件尺寸測量,中英文字元識別,產品缺陷檢測,質量監控,目標跟蹤等。機器視覺在工業上運用需求非常複雜,系統比較難產品化,即使同行業但是不同產品所需要的演算法可能都需要重新開發,對研發人員來說比較有挑戰,有時是技術層面,但是更多的是體力上。嗯,不能再吐槽抱怨了。俺已經遠離江湖好久啦啦啦:)


在製造業的缺陷檢測和自動化生產應該有用吧。


前景廣闊。

相對於其他感官,人通過眼睛獲取了非常多的信息、知識、經驗,以指導我們的生活、工作。計算機視覺也是如此,當機器真正具有可理解的視覺時,可以產生的生產力的增加,經驗的積累反饋是不可估量的。

簡單來想應用,可以說所有具備攝像頭的產品都會成為計算機視覺的潛在應用,這樣看,應用面就非常廣泛了。如金融、醫療、安防、家居、移動智能設備,等等。


目前已經很成熟的應用是人臉識別考勤系統,谷歌和百度推出了以圖搜圖但是精度還需要提升。實際的情況太複雜,目前的研究還不能滿足實際的需求,不過我覺著潛力是巨大的,可以想想如何讓還不太完美的技術幫助現有的一些產品。比如,驗證在一些互聯網產品中加入了計算機視覺技術可以帶來多大的幫助,當然這個幫助主要還是看能增加多少收入吧,


計算機視覺目前最好的商業應用方向就兩個,一個是生物特徵識別,還有一個就是視頻監控。前者目前已經開始有了一些商業應用,比如人臉識別以及考勤打卡之類的,後者目前還沒有很好的商業應用例子,國內的話,新興的格靈深瞳貌似就是在做這個,創始人還挺牛逼的,谷歌眼鏡的早期7個團隊成員之一,不知道現在做的怎麼樣了。


監控系統和生物特徵識別比較是能賺錢的吧。據說中科院的監控系統賣給小區一套一萬多(N年前)。不管怎麼樣還是很喜歡這個方向,理論跟應用都有很多有趣的問題。


找工作對口的研發職位很少的。到時開發當碼農很多。演算法基礎比較紮實到時很有用。


推薦閱讀:

如何ensemble多個神經網路?
如何自學平面設計專業的幾個軟體?
VOT2016有什麼值得關注的?
怎麼能夠有效地知道自己對計算機視覺哪個方向感興趣?
除了美帝的學校,哪些國家的哪些學校CS的ML,CV方向的PHD值得去讀?為什麼?

TAG:數據挖掘 | 模式識別 | 計算機視覺 |