海康威視研究院在計算機視覺、模式識別這方面的技術水平如何?

主要想求業內人士分析一下海康這邊的技術和最近兩年計算機視覺創業公司,像face++,sensetime,格林深瞳之類的相比如何?


已離職,關於海康及研究院的相關問題,已不方便回答,見諒。

剛好在海康威視研究院工作,也剛好在從事機器視覺(目前做跟蹤),模式識別這塊,我來為公司正個名吧。
為了防止泄密,也就針對幾個回復做一些解釋吧。
首先就是有人說到了海康、大華車牌識別做得特別好。這個確實是做得很好,原因呢,兩方面吧,一方面是最早期做機器視覺就是從這車牌識別開始入手的,經歷過了這麼多年的積累和優化,已經是一款相當成熟的產品了。另一方面呢,也說的很對,確實是因為能賺錢,有錢賺自然是我們不斷努力,不斷進步的動力了。
再就是一些人回復到,就是個做安防,裝攝像頭的。這個通過我回復的車牌識別的問題,就可以基本上對這些人的回復進行反駁了。現在車牌識別也就完完全全是計算機視覺的範疇了,除了視頻圖像編解碼、存儲外,車牌的定位、圖像預處理、字元分割、識別等,都涉及到計算機視覺的方方面面,另外公司現在產品線也已經擴展到各個行業的方方面面了,都會涉及到機器視覺的相關技術。所以呢,你們說的對,海康是做安防的,是裝攝像頭的,但我們真的不僅僅攝像頭了。
還有就是那位在讀研究生所提出的種種了。確實是感覺有點太學生氣了,評論里有些人對他的部分意見進行了反駁,我就不多說了。海康每年都會有針對在校學生的開放日,誠摯邀請你過來體驗下,體驗後再發表相關評論不遲。
老實說,我當時來海康,也抱著發篇CVPR的願望(O(∩_∩)O哈哈~),但公司的狀態真的是和學校是有差異的。這個想必大家工作後都會有相應的體會的。身邊也有大學、研究生同學在百度IDL,阿里iDST的,那位說海康沒多少頂級會議期刊的同學,也可以去查查百度、阿里的這兩個部門在相應期刊上發表了多少的論文(我記得余凱先生前年是在ICML2013上發表了篇paper,拿到了Best Paper Runner-up Award了,好像不是第一作者)。而且,也不得不承認,作為一個成立剛一年的研究院,我們與這兩大互聯網巨頭的研究院差距也還是有的,我們現在已經在專利申請方面,有了很大的進步了,下一步,可能就是所說的頂級會議和期刊上的論文了。但我們也會不斷努力的,去年5月份習大大對我們部門的視察,也是對我們的一種莫大鼓勵了,我們會在這份激勵上繼續前進的。
另外這位同學也可以問問在百度、阿里這兩個部門的同學,你也會發現,這兩個部門也不是純粹做研究,發paper的。因為不管怎樣,部門的存在都是以實際需求為驅動的,這兩個部門也是以公司內部的實際需求為第一要義的。
最後再說說公司的優勢部分。有人說道海康的優勢是和政府部門打交道,將相應的產品賣給政府。是的,作為一個在校的學生,當然可以對這種行為嗤之以鼻。但走向社會後,你會發現這是很多人,很多公司都無比羨慕的一個優勢。而且現在國內安防方面的公司可不僅僅只有一家哦,海康,大華,宇視科技,天地偉業等等等等,很多好的企業的,為什麼我們能作為政府的第一採購商呢?為什麼我們能做到市場佔有率第一呢?要知道,除了政府機關,現在很多寫字樓,很多園區,很多單位都在使用我們的攝像頭和相應的一體式解決方案,這也是因為我們也自身在技術上的積累了。而且,您也可以去查查海康官網,現在我們的產品,在俄羅斯,北歐,南美,非洲,東南亞,都發展得相當不錯了,也佔到公司總銷售額的相當比例。
還有就是,現在做公司,雖然每家創業公司都標榜自己技術至上,但在中國,等到你真正成為一家公司的老闆後,就會發現,技術真不是公司發展的第一因素了,最起碼,你得拿出能維持公司運營的產品出來。這也是目前很多機器視覺創業公司所遇到的問題,都是以最好的技術作為公司的宣傳策略,但無論怎樣,首先,公司得靠產品活下來才行。

發現自己好啰嗦,講了大半天了還在瞎BB。。。

最後說兩點好玩的東西吧,也是實際項目中碰到的。因為保密原則,就不介紹細節了。

(1) 坐在我旁邊的是我同一個大學的師兄,有一天我路過他工位時,看到他在做一個很炫酷的東東,然後就很好奇滴問了兩句,他說,因為領導去XX公司考察(就是題主提到的某家學院派創業公司),覺得他們某個產品很炫酷啊,然後回來說我們也要搞,就交給他搞了。然後我問師兄,感覺很牛逼的樣子啊,技術含量太高了。他說還ok了,其實都由公司現成的工具包的,將這些現成的工具組合加以利用,再做一些相同比較炫酷的顯示效果,就行了。
說到這裡,可能大家會想到騰訊,會想到一些大型互聯網公司為什麼能很快地時間內,快速開發出,甚至超過某些小公司開發的新產品?因為我們不僅僅是有更好的渠道,更好的市場推廣,而且也因為我們有最好的技術儲備。這些技術儲備也是公司一代又一代前輩們努力的結晶。
(2) 再一個例子,就是我目前參與的公司最新發布的無人機了,該款無人機產品在去15年末的深圳安博會上發布了,也不涉及泄密的問題了。一說到無人機,大家肯定想到的是大疆,是零度智控。現在全國有上千家大大小的無人機公司,競爭異常激烈,包括騰訊,也發布了自己最新的無人機。應該來說,目前大疆在無人機領域的地位應該是不可動搖的了,但為什麼我們也要做?因為我們能利用自身的優勢,恰好和大疆等企業打一個領域差異化。試想想,如果某地路面交通極其擁堵或火災,這時交警通過無人機能將實時視頻回傳到自己的手持單兵系統與交警大隊的指揮大屏上,供領導和專家進行更好的決策,這豈不是很完美?要知道,交警的手持單兵系統,交警中心的指揮大屏也是我們海康自己的哦,也只我們才具有這個得天獨厚的一體式解決方案哦,這些也是大疆等無人機企業無法做到的哦。除了在交通路況,火災洪水地震等自然災害領域中應用,森林,武警,海防,石油行業中,海康的無人機相對於一些純粹的無人機公司,也會有一些無可比擬的優勢哦。所以呢,我是對公司無人機的未來,是充滿信心的,因為我們有自己的優勢(可以簡要概括為一體式解決方案的優勢),而這些優勢,恰好是其他企業所不具備的。我們利用好了自身優勢,也算是一種成功吧。

最後呢,打個廣告吧。我入職時,公司新人培訓,hr問我為什麼離開上一家公司,我說我離開上一家公司,是因為上一家公司太操蛋了。來了海康後,發現上一家公司真的很操蛋。應該來說,作為一家員工人數超過1萬的大企業,海康也有一些大企業的通病,但公司規範化的運作方式,會讓你受益匪淺的。最起碼,規範化的編碼規範,詳實的技術文檔,規範的流程管理辦法,會讓你覺得在這家公司可以安安心心做好自己想做的事情。可能等你工作一段時間後,再回頭看這段經歷,會覺得真的受益匪淺。

--------------------------------------------------------------------------------------------------------------------------------------------
再來補充一下關於計算機視覺實際項目中的問題吧,不涉及公司機密,就簡單講講一些事情。我想到哪講到哪了,見諒。

首先呢就是關於機器視覺中的檢准率和檢出率的問題,以前在學校,看到各種大牛paper,在各種頂級論文上公布的識別率蹭蹭蹭亮瞎狗眼,當時,包括現在,都是很佩服這些沉下心做研究的學者們的。但工作後發現,很多事兒可能真的不是想像的那麼簡單的咯。就是說,單純的追求一些性能指標,真的對工作會有很大的幫助嗎?要知道,我們最後是將產品賣給客戶的,而對很多客戶而言,他們根本不在乎您產品的準確率是98%、99%、抑或是99.9%,如果您說到您的某某產品識別率是世界第一,客戶聽到後只會覺得:哇,好酷~但最終他們追求的是產品的性價比和產品到底好用不好用。因為很多客戶根本不是從事圖像相關行業的,提升的幾個百分點準確率對他們意義可能真的沒有這麼大。對客戶來說,他們真正關心的是產品的價格,是否能夠穩定,能否很快上手使用等因素。就像我們去買車一樣,我們最關心的是車的價格、外觀、內飾、可靠性、安全性、油耗等因素,而這輛車能跑到295碼或300碼對客戶的意義真沒有想像的那麼大。
再就是大家從事實際計算機視覺項目開發中,可能會碰到很多參數設置的問題。往往在學校的項目,都會有很多參數需要去設置,比如說移窗設置多大呀,移窗步長設置多大呀,各種thres設置多大呀,這些往往很難有一套普適的參數設置的,而且真的的產品,這種參數數目會更多。而且很多參數之間往往沒有相關性,只能在實際應用中去一個個調試,找到最合適的值(舉個最簡單的例子,不可能天下所有攝像頭放置高度都一樣吧,不同的放置高度、角度,也需要設置不同的值),因此呢,以前我們在學校,也自己開玩笑道,做機器視覺,做著做著大家都成了「調參俠」------在沒有指導性方案前,我們也只能自己去摸索,不斷的調試優化,找到一組最好的方案,得到最好的結果。
這也是目前很多創業型公司所標榜的自己識別率多高多高,在知乎上也有調侃,就是大家都在調參的路上一路奔跑,沒有盡頭。但中間的問題,大家也知道的,我們的參數設置得越多,調得越來越針對某個特定的資料庫,很顯然這是一個過擬合的問題了。再一方面,ImageNet等等資料庫也不一定是真實世界的反映了,只是一個相當小的子集而已(這個大家可以參考CVPR2011這篇文章:Unbiased Look at Dataset Bias上所說的),現實中很多奇奇怪怪的問題是不會包括在這些研究性資料庫中的,當我們在研究性資料庫中調出了最好的一套參數後,你會發現,現實中各種奇葩問題會讓你各種崩潰的~~~反正我是碰到過各種奇葩的事情,包括雨天雪天等惡劣天氣採集的視頻呀,大風天氣攝像頭被風吹的各種抖動呀。而且,攝像頭一般都是發光發熱的,因為蚊蟲的驅熱驅光本能,它們最喜歡在馬路路燈下,(紅外)攝像頭前面飛來飛去等,各種奇怪現象都會對最終的識別有影響的。還有就是公司文教衛課程錄播產品(此項目已經發布,且早已在全國很多學校部署)中,你會發現小朋友們真是好動哦(起碼我讀小學是多動症的,上課坐不住),往往定位到一個小朋友後,會有很多小朋友干擾你的檢測。再就是現在的小朋友營養真好,很多低年級的小朋友都長到150、160了,快有小學老師高了,而還有小朋友也是個小不點,站起來可能都沒課桌高,就更別提檢測了。
再就是以前在學校做項目時,往往一個特徵對目標的可分類性不強,我們就多加幾個特徵唄,美其名曰combine features。在實際項目中,因為可能會存在的各種奇葩場景,單憑靠一套演算法打天下真的很難做到了,我們有時候也需要combine各種features,各種methods的。
還有就是那位同學可以去問問在阿里、百度工作的同學們,往往在數據挖掘,數據分析中(特殊場景除外),使用得最多的,往往就是那些最簡單的方法,比如邏輯回歸,線性回歸,決策樹,簡單的神經網路等等。為什麼呢?因為簡單,高效,易推廣,並且穩定。很多在實驗室中最優秀的演算法,可能在真實應用場景中真的沒有想像得那麼好的,你能否保證這些最優秀的演算法拿來用就比那些經典演算法更加穩定呢?要知道經典之所以能流傳,是因為得到了無數前輩們前仆後繼地驗證了的哦。

又扯了一堆廢話。。。。真啰嗦。

最後再回到檢准率和檢出率吧,在學校呢,我們往往希望我們的演算法檢准率和檢出率都高,這樣才顯得我們演算法高大上。但工作中呢,往往因為一些客觀原因,我們不得不做一些取捨和權衡。比如在監獄、軍事封鎖區、海防等場景的入侵檢測上,我們寧可犧牲檢准率,也要保證檢出率。因為這些場景中,多出一點錯檢沒關係,頂多再去人工複核一遍了,但如果檢出率低,出現了漏檢,後果就會很嚴重了。

就這些吧,說多了怕被領導拉去談話了~~~

======================================================================
距離上次修改已經有快半年的時間了,這半年經歷了很多,公司和研究院也取得了很快的發展,可以與大家分享下。

年初,研究院同事Yuan Zhang, Di Xie and Shiliang Pu,在MOT Challenge 2015上,取得了第一名的成績(可參考鏈接:MOT Challenge,可以查看相關新聞介紹,不過現在已經落後到了第三名,但也是很不錯的成績了),說明研究院團隊在圖像演算法的前沿技術研發上,也已經取得了比較領先的地位。同時,我們也將已有的RCNN、fast CNN、faster CNN不斷改進優化,目前已應用在很多公司實際的產品上。今年年中總結會議上,研究院領導也表示,公司在針對圖像的前沿科技探索與創新上,已經走在了前沿,希望我們能再接再厲,打造成更頂尖的研究團隊;

這半年在知乎上也認識了很多朋友,有很多知友私信我詢問公司的相關情況,很欣慰看到公司越來越得到大家的認可和興趣。現在研究院在模式識別工程師、大數據工程師、數據挖掘工程師等崗位上,只傾向於招收頂尖大學985研究生,老實說,作為一名普通的演算法工程師,我個人比較對這種唯學歷招人的做法嗤之以鼻。但一方面,說明由於研究院知名度的提高,有更多更優秀的人才願意選擇加入,為了方便用人部門更加精簡地篩選出合適的人選,也只能通過這種硬性匹配的方式達到目的。另一方面,也說明公司在一些前沿科技的探索上建立了更宏大的目標,希望依靠於更優秀的人才,做出更好的成果,服務於公司,服務於客戶。以上。

================================================================

最後一次更新:

ImageNet2016競賽海康威視研究院:
Scene Classification第一名,Object Detection第二名,Object Localization第二名,Scene Parsing第七名。

具體資料可以查看:
【高手之道】海康威視研究院ImageNet2016競賽經驗分享 - 知乎專欄

CVPR2017,accepted
http://cn.arxiv.org/abs/1703.01827
All You Need is Beyond a Good Init: Exploring Better Solution for Training Extremely Deep Convolutional Neural Networks with Orthonormality and Modulation

慢慢來吧,現在頂尖論文也有了,研究院也一步步越來越好了。

已離職。


海康威視作為視頻監控領域的領軍企業,整體技術實力是不容置疑的,只是在智能分析相關產品上,老闆其實一直不夠重視,或者說,最近幾年一直在觀望。記得6年前他們的胡總曾經說過:跟你們說實話,5年內,我都看不到智能視頻爆發的跡象。原話記不清了,大體意思是這樣的。現在看起來他的預測也是有一定道理。有點離題了。關於人工智慧相關的技術,海康一般是採用拿來主義,也就是說,把優秀的演算法集成到產品當中,他主要做產品化,雖然他們也有自己的研發團隊,但其實並不是很重視,其實這很容易理解:國內浮躁的氛圍,做研究的都在想辦法包裝炒作,更何況海康內部那些研究人員,搞不出啥名堂的,我相信老胡其實清楚得很,那為啥還要自己做研究呢,一方面,為了能消化吸收國外優秀演算法,總得有個懂點吧,另一方面,也是為了做個備份,討價還價也好有點底氣。世界是平的,海康現在已經是全球化的公司了,技術合作方早已遍布全球,這麼跟你說吧,幾乎全球最頂尖的研究機構,都跟海康有合作,已經有很多海外項目案例了,其實智能方面,還是國外客戶比較理智。雖然新興的視覺公司,可能有一些人才的確比海康國內的研究人員強,但這並不意味著最終產品會比海康強。玩技術沒有意義,主要看產品。DVR難做么?不難,但你能做到跟海康一樣好用不?一年半最多死機一次,你能做到么?大量的研發人員其實都眼高手低,用opencv做了demo,或者用caffe訓練出模型識別一下阿貓阿狗,閱讀tensorflow學點符號化編程,就開始信心爆棚了。半桶水最喜歡晃蕩了,真正的高手,比如caffe的作者賈SIR,都是很低調很謙遜的。浮躁的環境,不僅做不好研究,甚至連產品都做不好的。國內為何有那麼多公司對炒作樂此不疲,卻不願意踏踏實實做研發呢?答案很簡單:一方面,國內客戶腦殘者居多,這是對C端業務而言;對B端業務,領導也希望跟造勢的公司合作,他們最關心的是,萬一有問題,屁股就坐不穩了。"你們看,連xxx這麼niubility的公司都搞不定,那就不是我的事兒了",其實是否技術真niubility,領導心裡清楚得很,但那已經不重要了。"寶寶心裡苦,但寶寶不說"

(提到的公司,如有不對的地方,還請多多包涵,並與我聯繫,我可以修改或刪帖,謝謝)


類似的公司有SenseTimeCogtu 知圖科技、碼隆科技、 Linkface、Face++、格靈深瞳、曠世科技、大華、海康威視、華為、美圖秀秀、百度識圖、百度魔圖、深圳大疆。海康、大華和曠世、商湯的等主要方向不一樣而已


原來做安防監控的,現在開始做機器視覺了!低價策略,有錢任性~~~


哎!這杖打的,對於海康我是使用者我們工程做的多!舉一個非常簡單的例子吧!海康的球型機外殼是鐵的!表面上看是增加了重量實際上這種設計方式是為了散熱良好,其他用塑料做外殼的公司攝像頭裝上以後很快就會發熱燙手從而大大縮短使用壽命不信你們可以買兩個試試!在一個就是普通的功能調試軟體和產品技術說明是開放的!但是外國公司可不是這樣的!我們在調試霍尼韋爾產品的時候就遇到了各種麻煩!什麼都不給!所以海康不管研發實力怎麼樣但是他的運營模式相對還是比較開放的!希望繼續下去!其實產品研發應該結合實踐的,就算技術在NB一到現場就成了花瓶!在先進的技術也是廢的!也就是說你用的發動機是世界最先進的但是你的地盤和車身是全世界最LO的也可能是世界最先進的但是沒人會開也是白搭!誰用?有時候有些東西短時間內看起來是好的,可是是經不起時間的洗禮和現實生活的摧殘的!


海康的研究院關鍵要進對組,有的組真的實力很強(比如今年IMAGENET奪冠的那個組)有的組就特別坑爹,比如人臉組。他們的老大當時分享人臉演算法的時候,講道理我是真聽的驚呆了,這TM的是一個研究院性質的核心部門的老大??通篇廢話,漏洞百出,可以說是連很多常識性的東西都不懂,要扔我們學校早被噓聲噓死了。

感覺這裡的大領導們壓根沒搞清楚一個問題:如果領導是狼,手下即使是羊也能發揮出狼的實力,但如果領導是羊,你花重金招這麼多牛逼的畢業生,他們的自尊心又怎麼會願意聽一個完全不懂行的人指揮?這邊也算給未來來這邊的同事提個醒吧,謹進人臉組


畢業生還是想做視覺應用的很推薦之類的大公司,比如海康大華,大公司會教會你很多,代碼規範性,做事的規範性等等,另外,這兩個公司都有比較大的演算法團隊,主流的領悟都會涉及,是應屆畢業生鍛煉的好地方。而不是從一個小創業公司開始你的職業生涯。


我認為諸如FACE++,商湯科技 這種公司的所謂的技術不過只是停留在大學實驗室層面,就是忽悠投資人用的。一群剛畢業的學生沒有經過工程領域的積累,市場的打磨,只是在空想發PAPER,沒什麼技術含量。跟最近幾年打著「大數據」旗號之類的忽悠型創業差不多

海康無論從技術、資本、市場基本就是碾壓這些公司的存在。海康是一個巨鯨,那些創業公司就是一些小蝦米。這些小蝦米最好的結果也就是被海康,華為這些巨頭收購而已。


海康威視,在自然場景文字識別多個數據集上刷到了第一。

不禁讓人聯想,他們的車牌識別肯定已經爐火純青了。


海康威視:我們不生產技術,我們只是技術的搬運工


我投了海康威視的技術支持崗的簡歷,大概多久有回復?

請問技術支持崗能學的東西多嗎,成長的空間如何?


只說計算機視覺這一領域,業界來看,研究水平肯定第一梯隊,其他領域不了解。


海康的車牌是收了gdw的技術,自己搞一直不行,之前演算法組做視頻編解碼還行,其他稀爛!後來投入大了,搞起了研究院!


人肉特徵超級猛


海康威視給人感覺是做系統集成的


海康、大華和曠世、商湯的主攻方向不一樣,而且海康和大華也做了很久了,順便CV這東西最近跟風的是人臉,在我剛接觸CV相關的產品時應該是在工業上,那時候在國內某著名工業博覽會上第一次見到。

而且正如幾位朋友說的那樣,海康和大華有錢,如果真的哪天做不了自己演算法,也可以買,這個圈子也許並沒有我們想的那麼大。


海康和大華的車牌識別都做的特別好,為啥?因為能賺錢啊!

別的領域就呵呵噠了……


推薦閱讀:

如何看待國內機器視覺行業的發展?希望以公司為例盤點!
基於FPGA的機器視覺,如何系統地學習?
我想實現一個基於機器學習的較穩定手勢識別,識別6個手勢,分別是伸出0,1,2,3,4,5根手指。我打算只根據手的形狀來識別手勢。用哪種機器學習演算法比較好?應該如何準備測試集,應準備多大的測試集?
機器視覺的相機標定到底是什麼?

TAG:計算機視覺 | 機器視覺 | 海康威視 |