中國計算機視覺的前途在哪?機器視覺工程師又何去何從?
計算機視覺在國內已經研究幾十年了,但把計算機視覺成功帶入應用的大公司幾乎沒有。相比歐美的計算機視覺,中國計算機視覺的前途在哪?機器視覺工程師又何去何從?
如果你要從國內第一個做計算機視覺的人開始算,那時間跨度有可能比較長,但是從整體產業的角度,真正沉澱的時間不長,也就10年左右吧。
首先我想糾正一點,準確地說,計算機視覺在國外其實也沒有大公司,你說的大公司,有可能計算機視覺是其中一部分業務,僅此而已。但計算機視覺本身,不足以撐起一家大公司。以NEC為例,他們是從1974年左右開始做人臉識別演算法,綜合起來看,目前依然是業內無可爭議的老大。我們看看它的主營業務:
IT解決方案、網路解決方案和電子設備我們再把目光投向美國,目前公認做計算機視覺最強的幾家公司:谷歌,微軟,Facebook以及亞馬遜等,他們的主營業務,不用我多說大家也很清楚。看到了吧,大公司要麼靠解決方案(做B端業務),要麼做普羅大眾都能用到的東西(C端業務),光靠某個領域的演算法,是不太可能成長為大公司的。當然,也要看你這個大公司怎麼定義了,如果幾百人也算大公司,或許有。但特別大的公司,就沒有了。
越大的公司,一般來說,做的業務越低層,越能滿足人類基本需要。比如:搜索(獲取信息),購物,社交,通訊等,具體做這方面業務的大公司就不用我多說了吧。這些業務都是高頻高覆蓋率的業務,所以公司能做大。而計算機視覺,相對來說,要小眾許多。更何況,視覺本身是有條件的那類應用,光照,角度,像素等方面,根據業務和場景不同,或多或少都有一定附加條件。這意味著什麼呢?意味著你很難把它做成標準品,也就不太容易規模化。這就比較要命,如果針對很多用戶都需要做定製化,或者現場調參,那麼邊際成本就太高了。軟體公司靠的就是很低的邊際成本,比如微軟,賣出一份Windows和賣出幾個billion的拷貝,成本幾乎一致。有人可能會問,jacky你自己也做這個,而且做了那麼多年,既然有諸多問題,為啥選擇繼續堅持?你到底幾個意思?
有這麼幾個意思:1.這個領域的技術和應用都很有意思。從07年開始,我就迷上計算機視覺,一發不可收拾。2.不容易規模化也有他的好處,你不容易,別人也不容易,所以沒有哪家公司能一統江湖,也就意味著你我都有機會。3.計算機視覺領域的聰明人很多,我喜歡跟聰明人打交道,溝通不累。4.計算機視覺領域可商用的開源資源很強大,我有很多好的想法,也有實現的可能。5.我有強大的技術整合能力和經驗,牛皮真的不是吹的。計算機視覺領域有很多好的技術,演算法,開源軟體等,雖然現在不見得盡善盡美,但一直在往前推進。如何把技術整合成產品?限於篇幅,這裡就不展開了。而且確實需要具體情況具體分析。通用法則未必真的很適用。關於如何將技術轉化為產品,我會在知乎上開專欄,敬請關注。暫時先賣個關子。如果你對技術轉化為產品的環節有所困惑,也歡迎私信我或加我微信deepseetech
另外,我最想做的一件事,就是與志同道合的朋友成立一個計算機視覺技術諮詢機構,一邊對接科研人員,一邊對接產業鏈,客戶需求。幫助計算機視覺從業人員,尤其是技術人員,獲得他們應有的價值和成就。有興趣的朋友或機構,歡迎騷擾我,咱們好好聊聊:)
國內的計算機視覺人員出路在哪裡?
跟其他很多行業比,計算機視覺,其實很適合創業。剛才我講了,沒有一統江湖的大廠,這跟這個領域的特點有關。而且垂直領域的數據比演算法更重要,大廠也不可能什麼都做。每個人情況也不一樣,如果你擅長做基礎研究和演算法,而且只是想找份穩定的工作,建議找機會去微軟這樣的大廠做研究。如果你有技術但暫時沒產品沒資源,但將來想自己干,建議去國內計算機視覺公司先練練手,積累各方面經驗和人脈。如果有技術和產品,已經有客戶將要買單,可以試試創業。另外,如果有投資機構看好你,也不妨一試。雖然只以計算機視覺,要做成BAT那樣的巨頭不太可行,但它很可能會是你成功的起點!!!
值得一提的是,以上建議只是針對普遍情況,再說,每個人的潛質也不一樣,具體情況要具體分析,所以我都說"試試",希望不會誤導大家。
有空可以多跟業內人士溝通,而不是閉門造車,這一條,永遠都是對的。
前途便是,關注底層數學模型,其次演算法,最後才是調參數,講真如果關注最後一點,譬如Deep Learning,神經網路,那麼變成本末倒置,只能稱作工程而不是科研。下面鏈接乃計算機視覺領軍人物之一加州大學洛杉磯分校UCLA統計學和計算機科學教授Song-Chun Zhu的訪談錄,非常有指導意義。初探計算機視覺的三個源頭、兼談人工智慧|正本清源下面轉自我其他地方的一個回答。作者:Ruobing Shen鏈接:圖像處理專業的哪些方向就業比較好(碩士),主要去哪些公司? - Ruobing Shen 的回答 - 知乎來源:知乎著作權歸作者所有,轉載請聯繫作者獲得授權。樓主本科碩士應用數學+運籌學,博士海德堡交叉學科計算中心和圖像處理中心,組合優化+圖像處理的thesis topic,算是半正式地進軍這個領域。
先說方向,最好當然是計算機視覺裡面各個方向都有所了解,這樣才能融會貫通。
下面主要回答以後就業去向,同時我也會穿插它們所要求的方向。1,Google, MS, Facebook, Apple,華為,阿里,騰訊,百度等世界一流科技公司,無一沒有建立自己的AI實驗室,AI裡面,計算機視覺或圖像處理是非常重要的一塊,當然它們研究方向就多了,幾乎會涵蓋所有方向。2,世界各大汽車公司,如特斯拉,寶馬。汽車公司開始發力自動駕駛,而自動駕駛裡面最核心的技術就是「教」汽車裡的電腦如何通過攝像頭實時產生的圖片和視頻自動駕駛。因此視覺和圖像處理便是核心技術所在,如行人探測,道路識別,模式識別。3,Adobe,美圖秀秀等照片、winrar、real player等視頻處理、壓縮軟體。這個不多說,最最直觀的應用,比如降噪,圖像分割、圖像壓縮、視頻壓縮。4,AR(增強現實)最近由於Pockman GO的風靡全球又被推到第一線,而google class或者三星Gear眼鏡等等,也無不和圖像處理、計算機視覺的科研有關。預測這將是未來幾年主推的東西。5,迪士尼等各大電影製片公司。3-D電影,以及各種炫酷的電影特效,當然裡面不光有圖像處理,還有計算機圖形學的東西在裡面。6,索尼,華為,蔡司等照相機、攝像頭生產商。大家可知道相機或手機的照片拍出來,一般不是raw格式,jepg等格式已經是被內置的圖像處理軟體處理過後的照片了,另外相機里的人臉追蹤,快速對焦等等,無一不和圖像處理有關;再引申點,相機的靈魂CMOS CCD Sensor,當然這個更多的和物理光學有關了。7,地平線,大疆無人機等機器人公司。和自動駕駛一個道理,機器人要通過攝像頭「判斷」並躲開前方障礙物,核心技術都在視覺和圖像處理。8,醫療器械設備公司。醫學圖像處理,核磁共振,斷層掃描等等,眾所周知醫療行業都是暴利阿。9,工業級攝像頭;包括高速路上的攝像頭,機場火車站安檢攝像頭,工業流水線上的攝像頭,嵌入了人臉或次品識別的晶元,智能地識別罪犯、次品,等等。
10,未完待續,有時間回來再碼。最後插一句,想必大家也都聽說北美計算機TOP4出來的深度學習的Ph.D.,基本都是被Google,FB,Apple等以150w美元年薪瘋搶的狀態;國內名師出來的碩士,基本也是被年薪50w人民幣收割。這是一個大數據、計算機視覺最好的時代,因為入行即代表高薪;但也是最壞的時代,正如我開頭所說,學術界的風氣在被這個公司的功利性所引導,導致現在教授不做深度學習就拿不到funding..本人估計深度學習熱5年內會見頂,因為入坑的太多太多。最後的最後亮觀點:計算機視覺絕對可以入,但是請從運籌優化和統計分析的角度入,深度學習倆年後慎入。最好按照慣例廣告一波:
歐洲、北美、全球留學及數據科學深度私人定製諮詢,從此DIY - Ruobing Shen的文章 - 知乎專欄
中國計算機視覺的前途
1.不要只做系統集成,很多歐美,日韓的產品是可以超越的。2.計算機視覺做的最好的很多都是以色列的小公司,很多他們的產品是值得國內企業去借鑒的。機器視覺工程師的出路1.知道未來的trend,譬如3D肯定是十分重要的一個方向。然後結合你目前所處的行業無論是工業檢測還是其他,做一個這方面的延伸。
2.好的計算機視覺產品需要和硬體有效的結合。比如多了解光學的知識。3.嵌入式視覺系統開發翻出這個三年前的老問題來答一下
今年(2015)ImageNet圖像識別大賽中四類項目上奪得冠軍的隊伍是MSRA、Amax、CuVideo三個隊里的人全是中國科學家,其中第三個是中國的sensetime公司,他們的隊伍(CuVideo/CuImage)除了拿到視頻檢測的兩個第一,還取得了其他任務四個第二和四個第三的成績。所以哈,計算視覺這種新興領域,中國形勢一片大好啊!不僅是計算視覺,我敢打賭,再有5-10年,中國會在多個領域出現技術領先全世界的高科技公司。Reference:1. ILSVRC2015 Results2. 視覺識別奧賽華人包攬冠軍 中企首獲世界第一--科技--人民網
3. ILSVRC 2015大賽SenseTime聯合港中文囊括兩項世界第一有著計算機視覺領域「奧賽」之稱的ImageNet,堪稱計算機視覺發展的風向標,其中每一項競賽成果都對學界和業界有著深遠的計算機視覺技術可以為許多工廠的流水線做非接觸式檢測,但所用的技術和論文以及國外的公司比要低級很多,據我了解,一些很簡單的應用,比如檢測一下流水線上某種飲料是否已經灌滿,國外大公司看不上眼,國內做的公司和人都不多,市場需求還是挺大的。我一同學正在這個方面創業。
要說國內計算機視覺的前途,我覺得這些相比較而言技術含量不高,但需求比較大的地方才是目前國內的前(錢)途所在。因為這個市場才剛起步,高新技術大多都是高校在用,而工業上連最基礎的技術都還沒普及。
另外,如@李智輝 所說那樣,國內在智能交通方面的視覺應用確實已經比較多了,似乎有幾個公司也做得比較大,比如大華。最近聽說華為也想參一腳。所以問題中所說的「把計算機視覺成功帶入應用的大公司幾乎沒有」是不太準確的。如果題主在學校,可以關注一下校園招聘,應該可以發現一些做視覺的公司,一般能來學校招的,大公司和有錢的創業公司居多。
除了交通方面的視覺應用,在醫學圖像方面應該也是有市場的,不過同樣的,國內也是剛起步,去年就有個做醫學儀器的創業公司聯影來我們學校招聘,不過從他們筆試時的考卷和面試時的問題來看,他們目前也沒用到很多計算機視覺的技術,還是圖像增強技術為主。1. 國內的計算機視覺研究處於起步和增長期。如果你看好一些的會議,會發現09年以前,CVPR, ICCV國內基本上發不了幾篇,而從09年開始,特別是近兩年開始猛爆發。所以可以認為,現在的研究才開始與國際接軌,能做到一些魯棒,真實生活中的計算機視覺問題。所以我覺得能把視覺帶向現實應用的「大」公司也只是處於醞釀和起步期。
2. 已經有一些現實應用的項目和公司有:微信掃一掃,美圖秀秀,百度圖搜圖,Face++等。
3. 做過一個小觀察,在IOS上面的視覺應用大多都是照片編輯和美化,少量簡單的圖像識別(百度魔圖,圖標識別)。
4. 扯遠一點,一個比較現實的問題是,視覺還沒有像NLP和語音(對應的產業有 搜索,機器翻譯,SIRI等)一樣有獨立的拳頭產品和公司出現。而其實圖像的表意更豐富,攜帶的信息更多,處理方式也更與人類認知相近。一個主要的原因在於,對不限制場景的視覺問題上,現在的準確度還遠不能讓人滿意。這個阻擋了重量級產品的出現。kinectgoogle最近也申請了很多專利。目前這個階段更多是技術積累和布局的階段,等待革命性應用的推出。
參考Machine Learning之於Information Retrieval,Speech Recognition之於Siri
其實現在國內市場還未成熟,正是相當好的機會啊;我一直覺得創業要想獲得大成功,最方便的就是在處女地上耕耘;如果市場已經很成熟了,別人都做得好,那麼一般人要想成功就很難了。。。
作為中國計算機視覺的從業者/創業者和人工智慧的Phd(Pig has dreams)科研工作者,只能說,攻城獅永遠不要過分依賴技術的前景,技術的發展幾乎都不是線性增長的,要麼突然發展,要麼漸漸沒落被取代,真正決定前途和去從從來不是技術,而是人,更具體的說,應該是人判斷問題、解決問題的能力。技術大多時候只是手段,只要能解決問題,手段可以是多元的。
以上純屬個人觀點,希望對所有計算機視覺的同行有所幫助。
謝謝邀請,在小公司做智能交通領域的CV應用,這方面的需求還是很多的,比如做隧道事件檢測,隧道里,光照非常複雜(車前大燈,隧道的反游標志的反光燈),如何構建一個穩定的背景建模方法來檢測停車事件,還是有很多的工程問題需要考慮的,又如果攝像機是帶雲台的,又如何去檢測雲台的轉動並在停轉後自動學習新的背景,這樣就不會影響監控員去操作雲台進行巡查業務,也無需畫線圈。我覺得中國的機器視覺工程師要用自己的背景知識去解決社會需求的現實問題,在過程中積累工程經驗,這樣比較好
大的應用不知道,但是計算機視覺的創業公司這兩年還是很火的,比如格靈深瞳,商湯科技,曠世科技之類的,都還蠻有前景的~機器視覺工程師按我知道的情況應該都還蠻好找工作的啊,薪資待遇什麼的也都很高,嘀嘀打車最近準備成立一個演算法研究院,學習Uber搞演算法計價,開的待遇非常誘人,還有BAT這種巨擘對機器學習的人才都是求知若渴啊,前面提到的幾家創業公司也是一個很好的去處,基本都融了大筆的A輪,團隊成員技術都很強,還有原始股可以拿,就看你願不願意冒險搏一搏了。
再說說中國計算機視覺的前途,去看看CV的頂級會議CVPR上面的文章,超過一半的文章都是中國人投的,全世界優秀的CV人才中國佔了很多,當然絕對頂級的那一層依舊在美國,美國大學的實驗室以及Google研究院之類的地方還是有很多大牛的。
以下是個人淺見,之前的工業革命、電力革命、信息革命、互聯網、移動互聯網等中國都沒有抓住機會,日本、美國之類的就是抓住了這幾次新的技術革命的機會一躍成為了世界強國。現在很明顯的,人工智慧的時代正在慢慢接近,中國如果能抓住這次機會的話,很有可能會打一場漂亮的翻身仗,這一屆的政府也很給力,把人工智慧的發展也列到了戰略發展的地位。所以個人還是很看好國內的計算機視覺發展前景的,畢竟我Dang想做的事情,還沒有做不成的。用錢就能砸出大片的水花了~
1、大公司不可能單獨靠計算機視覺一個子模塊來單獨盈利,只會作為一個部分參與系統項目中發揮其作用。大公司搞的無人駕駛系統,計算機視覺是主要的核心,但只是一塊而已,需要的是整合系統的很多技術。中國現在很多創業公司都在搞計算機視覺,就是由於不成熟的市場、技術未落地導致的,畢竟是風口,如碼隆科技、 Linkface、Face++、格靈深瞳、曠世科技等都是創業公司。前途是非常有的,別擔心
2、計算機視覺與機器視覺不一樣,別混淆了。計算機視覺是賦予計算機眼睛,如人臉識別等。機器視覺是賦予機器眼睛,如瑕疵檢測等。但是本質是通用的,但別混為一談
謝邀。
計算機視覺現在沒有出大的公司,可能原因有兩方面,一是技術上仍然不夠成熟,二是從業人員的視野不夠開闊。這兩方面可能相輔相成。
我現在能看到的計算機視覺未來的應用,可能有自動駕駛(無人車、無人機)。這個行業的市值非常大,因為涉及到製造業,所以做起來的公司將比滴滴打車和Uber還要大很多。無論現在自動駕駛使用了什麼樣的技術,將來一定是計算機視覺技術來統治。為什麼?因為我們所在的世界,並非自在世界,而是人為世界。只有以人的視角來感知、理解這個世界才是真正認識這個世界、與這個世界交互的正確打開方式。說個簡單的例子,如果車的前方出現一個障礙物,這時候司機應該如何處置?如果是一塊磚頭且車速較慢,可能不減速直接開過去了;如果一塊帶鐵釘的木板,可能車會繞著過去。這兩個物體對雷達、紅外或者激光來說可能都是一樣的,能分辨兩者屬性不同的,只有在可見光這個波段,以人的智慧來判斷是可以直接碾過去,還是需要躲避。
另外一個方向就是機器人。機器人將來一定是很大的一個產業,特別是如果機器人能聽會說能看的時候。能看就要依靠計算機視覺。要有SLAM、有對象識別。在對象識別上必須要依靠圖像語義分割、圖像分類這些基本的計算機視覺技術。
最後說一個我司正在研究的項目,線上虛擬試衣,也是計算機視覺的一個應用。我們利用計算機視覺技術對人體和服裝進行建模,然後做在線試衣、穿搭。歡迎大家一起探討。也歡迎各路英才加入我司。
~~~~~~~
加一個寫漏的點。對象識別與三維模型。最近精靈寶可夢火得不行,其實這個點我們也是早就想過。也許將來有一天遊戲的形態會有大的改變,玩家可以通過手機(也許是Hololens這樣的設備)對周圍的場景進行掃描,建模,完成對象識別,這樣就可以將現實世界生成遊戲地圖,在這個地圖上開戰。我覺得這裡的對象識別的任務是很重要的。要能識別面前的一個圓形的東西是一個水塘,丟個石子進去就會有漣漪;如果是一間屋子,能識別出來哪裡是門哪裡是窗,從而允許玩家破門而入。
我對這一天充滿期待。轉自公眾號:AI不忽悠
近日,忽悠哥看到一篇文章,題目是《我們花了40個小時為計算機視覺「部分價值」做了個年中盤點》。全文羅列了國內部分計算機視覺企業及簡介,還打了個分。各位看官先看文章,忽悠哥再點評。
全文如下:
毫無疑問去年的風口在直播,今年轉向人工智慧,除了巨頭們不約而同的開發布會宣布自己 AI 方向的戰略布局,越來越多投資人和創業者也爭先恐後的 ALL IN 入場,其中最火,也最具商業價值的非計算機視覺這一領域莫屬。知道 AI 的人多,了解計算機視覺的人少,這究竟是個怎樣的行業,又有哪些「有意思」的公司?
2017 已經過去一半,我們是時候對上半年做一個總結了。
- 我們為什麼需要人工智慧?
自深度學習概念引入以來,人工智慧的發展速度有目共睹,信息科技的發展按照指數規模爆炸,將導致存儲能力、計算能力、晶元規模、帶寬規模暴漲,引領第二次自動化浪潮,AI 得以逐漸成長為了遊戲高手、圍棋大師、語音轉錄專家、司機、翻譯家、圖像藝術家、鑒黃師、武器……,她正在以不可估計的力量改變著我們的生活。
人們也開始嘗試利用人工智慧技術幫助改善一些勞動密集型工作,以及高精度業務,因為它能持續地像人類一樣正確描述照片上發生的事,不會感到疲倦,還能閱讀並概括出文本大意,最重要的是它還在不斷的學習進步。
就像谷歌的聯合創始人拉里·佩奇早在2002年說的,谷歌不是用人工智慧強化它的搜索能力,而是利用搜索來改善它的人工智慧。
- 計算機視覺風口和難點
計算機視覺是一門研究如何使機器「看」的科學,它能夠用攝影機和電腦代替人眼對目標完成識別、跟蹤和測量等工作。
像素級的處理讓演算法得以伸展,我們可以從演算法的發展來看計算機視覺的變化。傳統演算法大致可以分為以下4個步驟:圖像預處理、特徵提取、特徵篩選、推理預測與識別,毫無疑問,這需要大量的經驗,需要你對這個領域和數據特別了解,然後設計出來特徵還需要大量的調試工作。而引入深度學習後,效果得到大幅度提升,一大批如「DeepID」人臉識別、「Region CNN」物體檢測、DeepTrack物體跟蹤等開源演算法的出現讓技術的商用變成可能。
從成熟度曲線來看,語音更靠前一點,然後是計算機視覺,特別是安防領域,封閉的場景,有一些孤島化分布的大量數據可以用於訓練,在這些領域它是有先發優勢的。
- 業內典型公司盤點(排名不分先後)
相比圖像,視頻擁有更多可能,而如今像素的世界已經延伸到圖像以外,人工智慧技術能夠使得從視頻中提取信息變得跟從圖像中提取信息一樣簡單。
這次我們在視頻內容識別技術領域作了一個統一整理,挑選了其中做得比較好的24家公司進行比較,它們分別來自廣告營銷、遊戲、企業服務、醫療健康、金融、娛樂、電子商務等領域,均已超過A輪,並且專註於文娛類的公司數量遙遙領先,其中以服務於直播監測和廣告營銷為主要發力方向。
1、商湯科技技術實力: 人才優勢: 產品商業化:商湯科技是一家典型的深度學習演算法公司,目前是國內該領域,技術團隊規模最大、商業化訂單、收入及融資額最多的公司。由國內頂尖的計算機視覺專家湯曉鷗、徐立創立於2014年,其中技術團隊佔比高達90%,其中包括5位微軟研究獎獲得者(Microsoft Research Fellow),兩位A-star(阿里星人才計劃),聚集了華人世界中一批深度學習和計算機視覺領域專家。商湯科技早期專註於安防領域,現在擴展到互聯網+,應用最廣泛也是受眾群體最大的一個應用是為FaceU提供的精準的人臉檢測和跟蹤技術,能夠將Face U 的裝飾和貼紙準確的貼在人臉五官上。之後會將攜手 Star VC 打造命名為「未來科技研究中心」的科技產業孵化器。2、曠視科技(Face++)技術實力: 人才優勢: 產品商業化:這個成立於2012年的公司目前已完成C輪融資,總估值高達20億美金,是目前估值最高公司,商湯科技第一競爭對手。Face++專註於人臉識別技術和相關產品應用研究,面向開發者提供服務。擁有一套非常強大的人臉檢測系統。在世界最權威的人臉檢測(FDDB評測)、人臉關鍵點定位(300-W評測),和人臉識別(LFW評測:99.6%)獲得三個世界第一,在安防領域的成績也是有目共睹,為支付寶、Uber、中信銀行、萬科等知名企業提供 SmartID 服務。最值得關注的是,2016年7月正式加入曠視(Face++)的首席科學家孫劍,曾經作為微軟亞洲研究院首席研究員,帶領的團隊於2015年獲得圖像識別國際。3、格靈深瞳技術實力: 人才優勢: 產品商業化:格靈深瞳是第一梯隊中唯一有在做硬體的公司,公司戰略方向會重點放在兩個應用領域,第一個最大的是安全領域,第二個領域是商業數據分析。短短3年時間,格靈深瞳逐步搭建完自己的「格靈深瞳系」——格靈深瞳繼續深耕安防和商業數據分析領域。為了進一步擴大影響範圍,於2016年與前英特爾研究院院長吳甘沙、北京理工大學姜岩教授,三方共同成立專註無人駕駛馭勢科技;近期還會涉足智能醫療領域。4、碼隆科技技術實力: 人才優勢: 產品商業化:碼隆科技與前三家公司不同,是與時尚業接觸最為緊密的一家公司,在面料識別和大數據色彩研究上優勢非常明顯,目前處於A輪狀態,發展非常迅速。從碼隆科技核心團隊成員經歷和A輪投資方不難看出與微軟及英偉達的淵源頗深,今年5月剛剛發布了國際版加上與英偉達的合作,非常有節奏的擴大自己的海外版圖。5、衣+(陌上花科技)技術實力: 人才優勢: 產品商業化:衣+ 主攻方向是在圖像與視頻中對場景、通用物體、商品、人臉的檢測、識別、搜索及推薦,幫助內容和平台實現場景營銷、智能分析和內容互動。從2014年創立以來,發展快速,產品線拉得也比較長,除了最開始的APP保留了下來,目前主打的產品有場景化營銷、智能搭配等,除此之外還增加了相冊分類和內容審核,幾乎涵蓋計算機視覺方方面面。近兩年又憑藉優酷在網生內容等領域的先行優勢,快速完善了技術+電商+視頻平台+內容的生態模式,形成完整的商業閉環。但這也成為他們一個羈絆,目前合作平台除了優酷土豆幾乎沒有與其它平台的合作。6、Video++技術實力: 人才優勢: 產品商業化:Video++專註於消費級視頻領域的AI科技公司,近年來也是發布了許多成熟的點播視頻方案以及一整套互動視頻直播方案,也和樂視、芒果、搜狐、鬥魚直播、熊貓直播等各大視頻網站進行了合作,將視頻識別技術運用到各類電視節目中,讓用戶在不反感的前提下進行廣告植入,據官方發布的數據,使用此類技術的月獨立UV量達到2.8億。在技術方面,Video++在跟蹤和識別方面擁有自主創新演算法,能夠準確的識別出明星、物體、品牌、手機、場景等等,使機器像人類一樣理解視頻的內容,並發現其中有趣的點。用核心組件和視頻應用將這些點進行商業化的變現,將機器識別出的結構化數據作為投放點,應用到廣告和電商的場景中。最值得關注的是,Video++將視頻行業與AI技術結合,打破以往的傳統商業視頻模式,通過為流量平台提供視頻AI、視頻電商、視頻互動廣告等系統應用,以視覺識別和大數據為基礎,來實現視頻場景匹配和廣告自動投放。7、雲從科技技術實力: 人才優勢: 產品商業化:雲從科技「國家隊」的身份為其帶來的優勢非常明顯,據了解,從 2015 年 4 月成立至今,雲從的客戶已經有上百家,客戶群體主要集中在金融、公安和商業。光是金融行業就是 50 多家銀行與非銀機構,目前人臉識別產品已經成為銀行業第一大供應商,並且由於在廣州省公安廳與河北省廳的出色表現,正在用人臉識別技術引領公安戰法變革。2017年,雲從科技會大力拓展安防領域市場,以金融行業的業務為基礎向其他行業拓展,為金融和安防領域的公司提供軟硬一體化解決方案也是雲從的兩塊核心業務。8、依圖科技技術實力: 人才優勢: 產品商業化:依圖科技創立於 2012 年,最開始從圖像識別入手,與全國省市級公安系統合作,對車輛品牌、型號等進行精準識別,隨後擴展到人像識別,通過靜態人像比對技術和動態人像比對技術,協助公安系統進行人員身份核查、追逃、監控、關係挖掘等。發展 4 年以來,依圖科技的產品已經應用到全國二十多個省市地區的安防領域,安防領域之外,進入智慧城市領域和健康醫療領域,協助政府構建」城市大腦」,甚至未來家居、駕駛、圖片搜索、購物等都是依圖商業版圖的一部分。9、小白世紀技術實力: 人才優勢: 產品商業化:小白世紀作為一家成立於2014年的人工智慧公司,在業內可能太過低調,並沒有太多聲音。他們目前對自己的定位是一家致力於視頻內容搜索的CBI(基於內容的互動)科技型創新公司。從產品發展脈絡可以看出,從視頻互動技術出發,經過兩年的積累邁入人工智慧行列,著力於智能搜索、廣告、內容審核等視頻內容識別相關技術研究,組建團隊並擁有自己的深度學習網路模型,這些對小白世紀能夠獲得Pre-A輪融資至關重要。不過,從目前可以查到的信息可以看出,小白世紀在人工智慧方向的核心人才並不突出,核心成員無技術背景,沒有首席科學家坐鎮,也未成獲得高質量的技術獎項和榜單,對其技術水平存疑。10、智視VCA(視連通)技術實力: 人才優勢: 產品商業化:智視VCA(視連通)是一家還處在天使輪階段以計算機視覺和深度學習為基礎的科技公司,雖然目前還只有「知·視」一款產品,技術卻涉及計算機視覺的方方面面,場景識別、生物識別、泛物品識別、大數據、深度學習、VR/AR等計算機視覺、智能人機交互、人工智慧等領域。儘管年輕,視連通有著清晰的商業模式,目標客戶是面向視頻產業的內容生產方、廣告主、各類播放平台以及更廣泛的電商、社交和信息類服務提供商。對收費標準也很理性,兩種收費模式並行,一種是按照視頻分析時長或內容量級進行計費,另一種則是按照一定場景化廣告展示或交互的比例收取分成。不過在技術人才方面有所缺失,核心成員均非人工智慧相關領域研究人員,也未與其他院校及研究機構合作,也沒有自有資料庫,但值得注意的是,他們已經申請了兩項專利(由於時間原因尚未披露),具有一定的技術保護意識。
- 最後
計算機視覺技術的市場需求日益增多,投資風口也在繼續擴張,為更多初創型技術公司帶來希望。
不過現實也是很殘酷的,大量的計算機視覺技術創業公司都集中在智能安防、醫療等垂直領域,原因很簡單,大量有價值的數據都掌握在BAT手中,初創公司無法僅憑一己之力建立一整套完善的數據樣本庫,這對實現商業化非常不利。另外計算機視覺的技術門檻高,研發周期長,容易造成資金鏈問題,這些都是創業者需要看見的,不能一味的 ALL IN 入場。
科技讓我們擁有了能夠想像未來並掌握未來的能力。
忽悠哥點評:
如果靠網上搜集的資料就能寫盤點,還要盡調幹嘛啊?
過去幾十年,計算機視覺的應用似乎主要集中在車牌識別、智能交通等大眾不太了解的行業。做視覺的公司普遍比較專,而非大。就像在Google大力推無人車之前,又有幾人知道早在十幾年前這項研究就已經開始了。但近幾年已經有很大的變化,各大互聯網公司也開始在視覺領域發力,比如百度的IDL,可以看看他們的[主頁鏈接](Research Topic)。
現在大數據的和Deep Learning的興起,視覺與機器學習的交叉融合,學術界與工業界的相互合作,機器視覺不火也不行了。