嵌入式、深度學習和計算機視覺
公司配置的新玩具——繼TitanX之後,又祭出一件神器:Jetson TX1 development kit。果然有時候公司比實驗室更有資源之優勢。這個開發者套件是開箱即用的,自帶ubuntu14.04的操作系統,只需簡單幾行命令就可以set up。安裝JetPack (Jetson Development Pack)之後,就有了所有需要的東西:CUDAcuDNN (Nvidia CUDA Deep Neural Network Library,是經過CUDA加速的深度學習庫)Opencv4Tegra (from Opencv community,一般是做實驗時快速實現用,此版本是針對Tegra開發板的優化版)VisionWorks( from Nvidia,是production的工業級工具,可以直接投入應用)OpenVX(from Khronos,是計算機視覺應用跨平台加速的標準)
VisionWorks把CUDA和OpenVX封裝好,把OpenVX經過CUDA進行GPU運算的優化。而OpenVX具有跨平台特性,所以開發者在編寫代碼時相當」舒適「。其中,VisionWorks官方給出了兩個workshop的視頻,可以幫我們初步了解它。workshop視頻1:introductionworkshop視頻2:simple CV tasks with Vision Works
OpenVX似乎優勢明顯,雖然作為一個研究者,平時更多地是接觸opencv。2.關於前景——Jetson TX1能帶來什麼革命 :未來機器人、遙控無人機、監控攝像頭、智能汽車都將獲得突破。機器人可以進行人臉核實(face verification)、物體識別(object detection and recognition)、場景識別(scene recognition)、動作識別(action recognition)等等,更好地與人進行交互。無人機在鳥瞰的視角可以進行動態移動物體的檢測和監控。監控攝像頭可以掃描人群,進行人臉識別(face recognition),同時進行異常行為檢測(abnormal activity detection)和暴力場景檢測(violence scene detection)等等。智能汽車可以通過車載攝像頭獲取一個或多個視頻錄製的街景信息,經過分析綜合,實現場景文字識別(scene text detection and recognition),分析路牌店名等。可以結合GPS進行更深層次的信息挖掘(data mining)。還可以利用基於深度學習(deep learning)的計算機視覺(computer vision)演算法和其他感測器(sensor)的信息融合(information fusion)實現更棒的自動駕駛。官方給出了一些初步成功案例,印證了我的期待,比如social robot JOBO,還有遙控無人機Kespy.除此之外,我預言體育實況轉播也將獲得突破。與增強現實(AR)結合起來,更直觀地表現內容。在這個網頁中,Viz Libero展示了目前可以做到的頂尖水準,但它仍然需要專業的人工干預。我預測,未來或許會提供虛擬現實(VR)的賽事轉播,使得用戶戴上虛擬現實設備,能夠獲得現場觀眾的視角,像在現場一樣可以左顧右盼,和現場其他球迷一樣為自己鍾愛的球隊歡呼。更進一步,VIP用戶可以在某個精彩進球回放時,通過無人機的錄製畫面,獲取球員視角,從主觀視角(egocentric view)來」體驗「進球的快感。應用在體育教學領域,可以成為更好的教學工具。當然,類似地,也可以成為體育教練更好地講解分析的工具。有些公司(比如,VRSE)已經推出了手機和平板電腦上的虛擬現實(VR)app,讓我們可以初探究竟。身臨其境的演唱會,視頻遊戲,這些領域最先引起了產業界的重視。雖然目前的state-of-the-art還不能達到我期待的水準,但不久的未來一定會成為現實。很高興我是其中眾多研究人員中的一個。當這些都能成為現實的時候,希望我個人的商業計劃也可以在那時部署實施。(因為是前所未有的東西,所以暫且賣個長遠的關子)對未來充滿期待!寧廣涵2015年12月2日分享
推薦閱讀:
※基因在X染色體上的基因頻率的計算題一個
※拼箱虧艙費如何計算?
※裝修地板磚價格如何計算?
※干支紀年法的計算
※規模化豬場各類豬存欄及欄位數的計算(2)