人臉識別哪家強?
1. 人臉識別哪家做的比較好呢?
比如:雲從科技,Face++, sensetime, 依圖科技 等
2. 有沒有公開的第三方評測?(自己說自家好沒啥意思)
本人從事人臉識別相關工作(先匿名),這一波人工智慧的投資風潮起來,很多人臉識別公司恨不得馬上往自己臉上貼幾噸金,看看百度自動駕駛的系統和google圖像識別系統的開放可以預知未來免費是大趨勢,想想人臉識別演算法跟曾經投入數百億美元的自動駕駛演算法相比有多大差距。
人臉識別作為一項模塊技術很少有獨立應用(獨立的業務層設計),大部分只是為已有的業務軟體體系上做增強,比如客戶人臉校驗(在過去密碼基礎上增加一層),人臉檢索(比人工高效,攝像頭結果過濾),相似人臉推薦(比如婚介軟體,整容設計),但是這個過程中已經死掉大量公司。目前相關產業公司在已知的主要商業模式中都在實踐,但賣貨,賣授權,賣服務,或者後台流量變現四大商業模式中,都沒有看到一個公司有。
1. 演算法再好,也只是調味料,最終出路還是做到最終產品中,通過業務層疊加開發,解決真正問題的產品和方案(最早發明FTP,壓縮演算法協議的誰賺錢了?)。
2.人臉演算法的使用成本很低,目前市場上終端演算法部署比較低端的產品授權就500元/套(1:1的遠程介面調用所使用的前端授權),市場競爭的結果就是低價傾銷。
至於未來有沒有新商業模式出現,暫且無法推斷。
--------以下為答案--------
首先,題主問題比較寬泛(到底是盈利強,還是演算法強,還是應用強?),人臉識別技術的衡量維度太多,但從技術比較,比如圖像比對級的1:1,1:N,N:N;衡量的標準和維度都不同。比如演算法精確度上,國內國外的人臉識別技術大多數在開源OPENCV等開源庫上進行新規則添加(深度學習進行疊層運算),公司之間的識別正確率差異僅僅在小數點上,99.6%-99.7%提升意義不大,如果說在LFW上稱王稱霸就是世界一流,就要被內行笑話了。
衡量人臉識別的演算法能力:拒識率、誤識率、通過率,準確率。
先看看人臉識別的基本流程:
人臉識別最難的部分是有充分適應各大光線環境的人臉預處理演算法,需要在各種複雜的光線環境中提取到人臉信息,特別是移動互聯網時代,攝像頭拍照的地方可以在斑駁的樹影下,也可以在昏暗的街燈下,以及深夜計程車內,這對演算法的魯棒性考驗極大。同時還要考慮照片和視頻欺詐,二次成像的光線污染等問題。
下面說一下目前人臉識別的常見問題(不要再問人臉識別準確度了,這個是外行話)。
1:1人臉識別演算法主要用於身份驗證
1:1人臉識別技術主要是利用圖像處理技術從圖像中提取人像特徵點,利用生物統計學的原理進行分析建立數學模型,即人臉特徵點模型。再從人臉特徵點模型與被測者的人的面像進行特徵分析(可以假定為無數的幾何特徵點求解),根據分析的結果來給出一個相似值,通過這個值即可確定是否為同一人。簡單的說就是A/B兩張照片比對,產生的計算數值是否達到要求。
這個值我們稱之為閾值,可以從1到100(100就是極端嚴苛)很多人臉識別公司說他們的產品很容易通過,那隻說了一半,如果閾值調整到5以下,幾乎大部分人都可以是相似的,而調整到95以上,同一個人在不同的背景環境拍出的照片都無法匹配。所以當一公司跟你吹牛演算法準確度,先問下使用的是用什麼閾值,同一人臉比對通過率,非同一人比對通過率。
1:1主要用於快速的人臉識別比對,作為身份確認的一種新方式,比如考生身份確認、公司考勤確認、各種證件照和本人確認,由於這些照片源不一定有權威統一的介面調用,所以一直沒有用起來。目前市面上做的比對來源主要有三種方式:
1. 用戶自傳照片,比如支付寶的人臉比對,用戶自傳的照片最大的問題是照片質量的合格率太低,拍照的光線、角度等因素會導致採集源的質量下降,不利於後期的大批量人臉特徵碼管理。
2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片的質量極差,2K的大小,很多照片上的人臉質量實際非常差,不過也是目前用最多的方式。
3. 使用公安部旗下NCIIC的人臉比對介面(注意,不是網紋照片介面,這個介面已經不對外),使用的是直接的人臉比對介面。目前具備有這個庫調用許可權的,目前所知的只有幾家,在人臉識別公司中,好像只看到一家在提供,這裡先不提了。BAT應該都還沒有接入,如有大家有新發現的可以補充。
實際上,解決比對源的問題的關鍵是需要有權威的照片數據來進行比對,許多公司剛剛開始的時候採取NCIIC(NCIIC是公安部的一個事業單位,公安內網是不對外開放的)身份證返照介面的照片,進行消網紋處理進行比對,但人臉的很多特徵點被損毀成功率大概只有6成(根據六月份發布的網路安全法,目前網紋返照介面市面上除了銀行系統可以使用外,其他所用的身份證返照介面都是非法的,一用就被查)。
1:1 人臉識別演算法主要使用場景
- 無證件的情況下,如何確認本人是XX?
曾經有一些問題是關於如何確認本人的笑話,派出所要求一個小伙證明就是本人,證明你媽是你媽。。這種奇葩問題,但是許多陌生場合也有這種尷尬,你如果沒有帶證件,警察無法看到你的照片,如何確認你就是XX就是之前經常出現的執法矛盾;如果一個人把身份證弄丟了,外面風雪交加,如何給這類人辦理酒店入住手續?這些就是身份確認的問題。公安部推身份證網上副本 身份認證可「刷臉」完成就是用來解決這個問題,我們出門不用完全依賴身份證可以確定身份,可以方便很多。
但是1:1人臉演算法的巨大隱患是我們隨處可見的人臉,實際就是一個公開的鑰匙,馬雲提出刷臉消費吃飯,如果沒有手機驗證碼(本身也是一重手機實名驗證),分分鐘鐘被吃垮。但是既然可以用手機,為什麼還用刷臉,不是多此一舉嗎?
另外還有一些高級會所,希望實現VIP的貴賓警報服務,這個在下面的1:N和N:人臉識別演算法系統中可以看到。但是1:1比對的身份應用哪家強了?
- 比如遠程的互聯網客戶,如何確認身份?
在互聯網買機票、車票,醫院挂號,政府惠民工程項目,以及各種證券開戶、電信開戶、互聯網金融開戶都會用到。過去的身份認證方式是非常不妥的(比如支付寶的持有註冊流程,還有一些不知名的社交APP等需要上傳身份證照片),這些資料是極其容易被盜取和轉賣的,下圖是來自百度的圖片搜索結果截圖,還有最近的一些女大學生的裸條資料泄露知乎專欄,導致犯罪分子有很多利用的漏洞,黑客軍團號稱資料2000萬,分分鐘鍾薅干一家金融平台沒有問題:
許多金融公司喜歡把人臉識別SDK模塊嵌入到APP當中,但這個太容易繞過,所以會再加上活體檢測(市場上常見的活體檢測為隨機動作配合),但是即便加了活體檢測,也一樣可以繞過。比如下面這兩種方式:
1. 3D人臉模擬面具
2. 人臉模型實時重建
所謂道高一尺魔高一丈,這個還是增加其他的多維校驗才能確認身份,否則真有人要進行遠程攻擊,也不是很難的事情。那麼活體檢測哪家強了?
1:N人臉識別演算法主要用於人臉檢索
跟1:1的A/B兩張照片比對最大的區別是A/B A/C A/D……多個1:1計算,這個最大的問題是一旦BCD總和數量越大計算速度越慢,而總和超過20萬,就回出現多個相似結果(20萬人這個大數會導致有不少人長相相似),需要人工輔助定位。過去我們在電影裡面看到什麼「天網」識別系統只是一種理想狀態,實際應用中都是排列出多個結果,排第一的未必是需要的人。
1:N人臉識別演算法主要用於排查犯罪嫌疑人、失蹤人口的全庫搜尋、一人多證的重複排查,以此相似度列出相應的結果,可以大大提高排查效率。類似的也可以用到走失兒童的項目中去,相比美帝的亞當警報、安珀警戒,國內有沒有類似的兒童走失警報及尋找機制? - 安全 - 知乎
這一類系統的部署需要兩個條件:
1. BCD基本庫(比如1000萬人)
2. 強大的演算法硬體
1:N同時作業就是N:N了,同時相應多張照片檢索需求,檢索耗費的時間跟硬體演算法關係極大,就這一領域的應用,又哪家公司強了?
N:N人臉識別演算法主要用於實時多1:N檢索計算:
N:N 該演算法實際上是基於1:N的演算法,輸入多個求解結果。比如視頻流的幀處理所用,對伺服器的計算環境要求嚴苛,目前的演算法系統所支撐的輸出率非常有限。
主要的限制如下:
海量的人臉照片解析需要大量運算(目前很少看到在採集端直接解析的,都是照片剪裁)
海量的人臉照片傳輸需要大量的帶寬(常見的720布控攝像頭抓取最小的人臉照片為20K)
海量的人臉照片在後台檢索需要耗費大量的運算(國內主流主機為例,最多到24路攝像頭)
由此可見,真正實現「天網」人臉檢索,一來要解決數億攝像頭的圖片處理,二來需要解決聯合庫的超算檢索,這可不是一般公司吃得消。有些小區和高級場所,對VIP客戶的識別和接待比較喜歡這種視頻校驗方式,但是實際部署使用者會受到攝像頭位置、角度,以及多人同時入場產生的問題,而且人臉庫會非常有限,不然計算時間長,體驗極差,一些所謂的迎賓機通常也就幾個人的照片(就是純粹給領導看的),實用價值大大的打折扣,有戴墨鏡或者帽子遮蔽都認不出,畢竟關鍵特徵取樣有限。這又有誰強了?
拍照和直播APP的人臉圖像疊加
國內比較多的娛樂APP通過對人像圖層跟蹤處理,也是一個不錯的技術切入點,但是產品安裝包會比較大,現在做的也只是跟蹤技術,屬於底層識別,如果複雜一些的需要通過雲服務實現,但是伺服器演算法解析速度和帶寬比較難以跟上,也不算是一種靠譜的商業模式。
人臉識別的技術發展方向:
結合三維信息:二維和三維信息融合使特徵更加魯棒
多特徵融合:單一特徵難以應對複雜的光照和姿態變化
大規模人臉比對:面向海量數據的人臉比對與搜索
深度學習:在大數據條件下充分發揮深度神經網路強大的學習能力
在視頻級N:N的校驗中,如果要提高通過率,很多時候是採取降低準確率的方式,降低演算法隊列數量;同樣在一些比賽中為了降低誤識率,大大提高了準確率,所以演算法在校驗的過程中必須遵循至少一個固定標準,追求的是速度效率還是最高準確率。
人臉識別應用的發展方向
人臉識別這玩意兒就是一個調味料,在千萬的業務解決方案中,就是一個小模塊,其他的都是業務層的開發問題,使用上,技術也未必要高精尖,如果一定要真正稱得上人工智慧組成部分的,個人認為未來最大的使用端是機器人視覺交互。
人臉識別演算法的應用分類派系:
人臉識別對應解決方案方向:
個人認為未來人臉識別會讓大部分的數據更加真實,而可以通過社會工程學模板做很多分析和改良,比如近期一些科學家利用人臉識別來分析一些人的健康、清晰,甚至是犯罪傾向,或許在未來還可以結合大數據,對我們過去傳統的面相分析技術做一個全新的提升,到時候算命先生都要失業了。更多機器人交互、無人機產生的攝像目標鎖定分析等科幻畫面並不是多遙遠的事情。
關於演算法核心研發情況的爭論:
基本上國內每家公司都會說自己的演算法牛,實際上有幾家有人臉核心演算法呢?國內在完全從事演算法研究的總工程師人數到目前(2016年)總計不到100人,不過也沒有現在問題也不大,中科院計算所山世光教授已經開源了SeetaFace開源人臉識別引擎介紹 - 知乎專欄,沒有基礎的公司不用太辛苦從零開始在OPENCV基礎上做演算法升級,相信很快google微軟還會有新的演算法發布。現在演算法基本都是98%以上,這點差距已經不重要,演算法核不核心也沒有太大問題。大家不用太過於焦慮,產品到應用階段,單單靠演算法可不夠,還要考慮實際的使用。
目前做人臉識別的公司很多,集成應用的有數百家,國內的看百度,看融資,看各種報道就差不多了,只是認真沉下心來做事情的公司太少。國內的騰訊和阿里都在做(阿里支付寶用的是自己的團隊研發演算法,只是特別低調,把名聲都留給自己投資的公司,阿里可不止投了一家),國內的公司吹牛逼的、炒概念的太多,就不聊了,講講老外吧。
- 美國Identix公司
- 美國Bioscrypt公司
- 德國Cognitec Systems公司
- 西班牙Herta Security公司
- 日本NEC公司
- 日本Softwise公司
以上都是老牌人臉識別公司,美國Identix公司做的是多模認證(指紋、虹膜),而Bioscrypt公司早期起於指紋識別考勤,在政府市場的份額都不小,德國的Cognitec公司主要做政府項目的人臉識別系統,而NEC公司主要做機器人視覺識別系統,西班牙Herta公司是一家學術很濃厚的公司。此外的還有一些以色列公司技術也很不錯。這些公司最強的一點是,幾乎做的都是政府的安全項目,特別是CIA用的最多,此外還有Facebook等公司也在進入這個領域,互聯網公司的加入主要是進行人群的分類和應用的優化(針對性的市場推廣),項目都是作為公司原本業務的一種補充,這類幾乎不用擔心客戶問題,因為這些公司本身就有很大的需求。隨著人工智慧的崛起,人臉識別未來會作為一個強大的功能補充,類似語音一樣,成為機器人的標配。
如果非要問人臉識別哪家強,不如問哪家公司吹牛逼強。
延伸閱讀:
關於人臉識別技術的泡沫解讀:機場火車站刷臉過安檢?請別神化「人臉識別」
轉載聲明:
這個文章當選高票答案有一段時間了,有不少厚臉皮的人臉識別公司市場團隊不斷轉載,並隨意修改。再次申明,請規範轉載。
可以參考7月18日的MS-Celeb-1M 競賽獲獎名單。
無限制類冠軍:松下-新加坡國立大學團隊(Panasonic-NUS)
有限制類冠軍:獵戶星空團隊(Orion)
作為一個不務正業的人,其實一直關注機器學習的問題。
之前的阿爾法狗學習了很多(如果阿爾法狗教人類下棋,會比人類圍棋師傅要厲害么?),前兩天還回答了個關於機器學習處理馬賽克的問題(在五到十年內,人工智慧能復原成人影片中的被馬賽克部分嗎?)。
人臉識別是我比較喜歡的內容之一,而最近,被稱作人臉識別「世界盃」的微軟百萬人識別競賽第二輪落下帷幕,讓人看到中國在這個領域取得的快速進展,激動不已。
今天就聊聊這個人臉識別問題。
記得當初最強大腦里,有人可以快速辨認很多人臉,驚呆了很多人,讓觀眾紛紛感慨人腦的強大之處。
然而,現場的人臉畢竟是有限,而且也只是那個極個別的人可以實現一定程度的識別。放在今天對人臉識別巨大的需求情況下,光依靠人力明顯是不可能的。
而這個時候,感謝機器學習的進步,使得我們可以用更好的演算法來讓電腦執行人臉識別,而人臉識別也隨之取得了更多的進步。
(機器學習過程)
如今,人臉識別已經有了取得了長足的進步,而為了方便大家的進步和交流,目前有不同的機構都成立了相應的面部圖像數據集。
————一,微軟百萬名人人臉資料庫————
我們知道機器學習的一個重要內容是學習,因此可供學習的樣本是十分關鍵的。一般常見的社交網站比如Facebook,新浪微博等都擁有大量的照片,然而他們的數據是保密的,所以大部分人無法獲取,因此很多人轉向了可以公開使用的資料庫。
在公開的人臉識別數據集里,比較著名的是LFW和MegaFace。
LFW是是美國馬薩諸塞大學的一個數據集,有1萬多張照片,屬於相似度比較的範圍。
MegaFace是美國華盛頓大學發布的數據,內容是幾十位互聯網明星照片加100多萬張普通人的照片形成的干擾數據。
然而這兩個數據集都存在一些問題影響了人臉識別的效果。
LFW由於數據太小,導致往往出現過擬合問題,且實踐過程是兩張圖片相似性的對比;MegaFace本身更傾向於人臉驗證問題,且由於MegaFace本身未進行人為標註,導致測試過程中容易出現大量的干擾雜訊。
有鑒於此,微軟亞洲研究院(MSRA)於2016年發布了一個全新的數據集微軟百萬名人數據集(MS-Celeb-1M),這個數據及首先保證了照片的數量,包含了10 萬個名人的約 1000 萬張臉部圖片,除此以外,微軟更是對照片進行了人工標準,比如標註了職業和性別等選項,這樣可以最大程度上避免對應錯誤的情況。
我們可以用一張圖來對比這三家的內容
由於微軟的資料庫具備了很多優勢和改進,因此這個資料庫一發布就受到了眾人的青睞,如今已經是世界上規模最大、用戶最多的圖像識別數據集之一。
————二,人臉識別競賽世界盃————
為了鼓勵眾人對人臉識別的參與,微軟還組織了人臉識別競賽(Image Recognition Challenge),這場競賽也成為人臉識別的頂級盛宴,被稱作人臉識別世界盃。
人臉識別競賽的要求很簡單,就是輸入一張人臉,要求輸出一個人名。這是一個標準的「端到端」問題,是一種最接近於現實的人臉識別,我們看到一個人,然後知道他的名字。
而根據是否可以自由的使用外部數據,微軟又將競賽分為無限制類和有限制類兩部分。前者可以自由的使用外部數據來進行輔助或者訓練識別。
而經過緊張的比賽,7月18日,比賽落下帷幕,最終結果呈現給公眾,我們可以在相應的網站上看到比賽結果。
Leaderboard of MSCeleb1M @ ICCV Workshop 2017
來自松下-新加坡國立大學(Panasonic-NUS)的團隊和來自中國的獵戶星空團隊(Orion)分別摘得了無限制類和有限制類的冠軍。
————無限制類冠軍————
冠軍是來自新加坡松下研究院和新加坡國立大學聯合組建的隊伍,兩家的標誌都是藍色的,蠻有意思的。
這個團隊是深度學習與計算機視覺領域的最頂級團隊之一,尤其是在人臉識別方面,更是屢次斬獲成果,他們曾經用LFW數據集實現了高達99%的識別效果。而這一次在微軟百萬名人人臉識別競賽上獨佔鰲頭,證明了他們的實力處於世界頂級。
在此次競賽單元中,他們選擇的是「Low-Shot Learning」,這是一個非常考驗在面對稀缺人臉訓練樣本的時候,如何精確識別的問題。
在這個測試里包括兩個庫,基礎庫(base set)是包含了2萬個名人,每個人提供了50-100張左右的人臉;而另一個全新庫(novel set)要小得多,只包含了1千個名人,且每個人只有1張照片。儘管最終的給出的考察樣本是兩者都有,但是明顯對於全新庫的考察更為關鍵,也就是稀缺訓練下的模型識別效果。
這種情況下,尤其考驗策略,NUS-Panasonic組採取的是用基礎庫來訓練模型然後去識別全新庫的辦法,且充分利用了競賽允許的額外數據來增強學習和訓練。
————有限制類冠軍————
來自獵戶星空團隊(Orion)。
這個蠻有意思的,一個來自中國的公司團隊,是獵豹移動旗下人工智慧公司。2016年9月才成立,然後不到一年就參與競賽並奪得了有限制類的冠軍。不得不感慨後生可畏啊。事實上在年初的LWF人臉識別的評測中,這個團隊就已經嶄露頭角,拿到了前三名的成績。
而在此次微軟百萬名人人臉識別競賽中,獵戶星空更是接受了hard模式。因為有限制的競賽只能使用微軟提供的數據,這無疑增大了難度,因為對於可以使用其他數據的無限制類比賽,某種程度上就是數據量的比較,只要使用足夠多的數據進行足夠多的模型訓練,一定會獲得一個很好的學習效果。而限制類由於數據確定,因此更多的是演算法層面的比較。結果無論是在random還是hard 中,他們都取得了第一的成績。
————三,人臉識別路上的中國龍————
事實上,這次競賽中,不止有獵戶星空一家中國面孔。
位列無限制類競賽的第二名,就是一家中國的團隊,
來自中國科學院重慶綠色智能技術研究院,這是2011年才成立的一個非常年輕的研究所,由中國科學院,國務院三峽辦和重慶市政府聯合建立的中科院直屬機構。
在此次競賽中,他們一舉奪得了第二名的成績。事實上,他們還是去年的冠軍。
在人工智慧領域,中國正在快速的進行追趕,甚至可能實現彎道超車。
根據普華永道預測,未來全球GDP將藉助於人工智慧的東風取得長足的進步,而中國和美國或許會成為人工智慧的最大贏家。
以國際計算機視覺與模式識別會議(CVPR)為例,這是IEEE一年一度的學術性會議,是世界頂級的計算機視覺會議,是人工智慧領域的A類會議,每次都是高手如雲匯聚一堂。
而在CVPR當前公布的接收論文名單里,華人學者佔據了近一半。
而在主席團里,也有不少熟悉的面孔,組委會一共25人,裡面可以看到的熟悉的名字就有9人。
此次微軟百萬名人識別競賽中,我們看到了華人的力量,無論是限制類的冠軍獵戶星空,還是無限制類的亞軍中國科學院重慶綠色能源研究院,都展現出了無比快速的進步,尤其是獵戶星空,成立不到一年就奪得了冠軍。這是一家公司,讓我們看到了在人臉識別領域,科技公司和資本的力量,事實上,此次參加CVPR會議的公司里,我們熟悉的那些互聯網公司不少都參與了,比如阿里巴巴,騰訊,大疆等
短短几年之間,人臉識別取得了突飛猛進的發展,這一方面得益於人臉是別的需求市場非常龐大,隨著平安城市的大力推廣,安防市場對人臉識別的需求迅速升溫,再加上我國城鎮化程度越來越高,使得人口流動性也隨之增高,這種情況下,光靠傳統的人工監控,無論是精力還是準確度,都受到了挑戰,因此對人臉識別的需求勢必增強。而另一方面,得益於機器學習取得的進展,這幾年以機器學習為代表的人工智慧取得了長足的進步,尤其是google 研發的阿爾法狗以高超的演算法和強大的學習訓練能力,在圍棋界連續擊敗人類,更是讓人們意識到了機器學習的巨大前景。
在這種情況下,依託於機器學習的人臉識別,無疑也跟著插上了飛躍的翅膀。從這次比賽湧現出來的以獵戶星空為代表的中國科技公司和技術力量,更是展現出了在這個領域的進展和追趕。
相信在這個領域,會有越來越多的技術力量進入,為人們的生產生活提供更多便利。
參考資料:
人臉識別界的「世界盃」榜單出爐,中國參賽團隊位列第二
踐行人工智慧發展規劃 創業公司獵戶星空實力「秀肌肉」
這個提問下面一水的廣告軟文
關注了很久,還是來講點乾貨吧
2017年4月11日更新
看著不懂行業最新發展的人還能得到這麼多贊,不知道是悲哀還是慶幸。
人臉識別和語音識別實際上都是一種基礎型的演算法,並不具備行業縱深能力,任何圍繞這個概念展開的投資,在未來幾年一定會失敗!!!
2017年3月20日回答的,根據最新的行業發展趨勢,本人反對這個答案,看未來幾年究竟是誰預測得對。
實質上,個人認為所有看衰語音和人臉的知乎用戶絕大部分現在沒有在一線企業任職。
人臉和語音已經是AI領域最接近落地的技術,大規模應用也已經開始,進展速度令人欣喜。
支持以項目和產品說話,反對繼續搞刷分宣傳。
大家注意了,一般只說自己刷分能力強的產品化能力必定很弱。
======================================================================================
第一、一切第三方評測都是紙老虎(就行業應用而言)
目前還沒有針對該領域的第三方評測,所以我臆測題主所說的第三方評測是指LFW等資料庫。
LFW、FDDB等只能測試演算法、刷成績,沒有其它用處。
哪家強?如何比較,第三方資料庫權威的話直接拿LFW成績去投標就行了,為何大多數項目還要單獨的POC測試?
那是因為真實複雜場景與資料庫場景是完全不一樣的!(業內的應該都清楚這一點,再拿LFW、FDDB等成績出來說事,那真的只是純粹為了炒作,比如前段時間的某企業刷新LFW紀錄,呵呵)就像學術研究與產業化還有很遙遠的距離一樣。
第二、為什麼說這些資料庫沒啥用?
1、數據少,以LFW為例,只有5000多人的1W+圖像,被眾多廠商拉出來反覆那啥,早就摸透了規律,對演算法進行針對性優化。這種演算法換個場景一樣傻眼。
2、不是所有人都會刷榜,FACEBOOK這些企業一般是刷一次測試一下演算法就閃人,還有更多的企業並沒有在這些個數據集上跑數據。
3、沒人會隨時刷榜,事情那麼多,還不賺錢去?一般的廠商刷個幾次,能拿個第一或並列第一可以炒作就跑了。
新來的一看,咋識別率這麼低,我輕鬆超越一丟丟,哈哈。
就這樣反覆,於是有好多個第一出現了。
這事還是沒演算法的公司懂行,管你們演算法好不好,買個過來提升設備附加值,設計一個簡單不容易出狀況的應用場景,賺錢最重要。
3、與真實應用場景出入大。真實應用場景會有各種各樣的情況,攝像頭位置不理想、客戶要求奇葩(如要求隱蔽式非接觸打卡)導致抓拍圖像不清晰、有遮擋、側臉、帽子、眼鏡,動輒幾萬人,數十萬百萬的庫,情況比資料庫惡劣很多。並且在某些需求中,識別率的要求並不是第一位,一個好的場景設計才能最優的發揮新技術的特點。
比如人臉識別迎賓和預警,很多企業吹得很牛逼,但是即使計算有資料庫那麼高的識別率99%+,那麼問題來,剩下的1%遇上十萬人的庫,警察叔叔還睡覺不?這能用嗎?
第三、行業確實發展很快,但國內演算法差不多的就那麼幾家。
排除一眾日德等國外技術的採購商,國內自己做演算法而且做得還行的就那麼幾家。
沒有誰強誰弱,大家在項目POC測試中都是互有勝負,還不能壓倒性的優勢。
T大陽光長跑的刷臉系統……
都是淚……
不過不是我的……都是學弟學妹們的淚……
1字班老學長趕緊溜防止被打……如果是基於深度學習的人臉識別,還不如把問題改為,誰的數據佔優勢?或者說,誰在某個特定場景下的數據佔優勢。
人臉識別技術是一種依據人的面部特徵,自動進行身份鑒別的一種技術,它綜合運用了數字圖像、視頻處理、模式識別等多種技術。通過人臉特徵提取和相似度比對,對於已經矯正好的兩個人臉,會通過某種表達提取初始特徵,然後應用知識模型對特徵進行處理,最後再在度量空間里來計算兩個特徵的相似度。這個分值會告訴你這兩個臉是不是同一個人的。人臉識別的過程包括:數據採集、人臉檢測、五官定位、人臉預處理、特徵提取。
騰訊雲人臉識別申請使用
1. 產品優勢
強大的人臉訓練模型:立足於騰訊社交數據大平台收集的海量人臉訓練集,成功標註的千萬人臉數據。
方法最全:高維LBP、PCA、LDA 聯合貝葉斯、度量學習、遷移學習、深度神經網路
技術最好: 優圖獨創Uface深度人臉模型,LFW評測以99.65%目前世界領先。實際互聯網金融場景測試,自拍-身份證縮略圖對比0.01%錯誤率,通過率95%
2. 人臉驗證技術(1:1識別)
人臉識別技術可以計算出兩張人臉照片的相似度,從而判斷是否為同一人,即1:1身份驗證。優圖人臉識別通過傳統方法和深度學習技術結合,以空間面孔牆和微眾銀行遠程核身為基礎,在性能上達到LFW 99.65%
3. 人臉檢索技術(1:N識別)
給定一張照片,和資料庫中N個人臉進行對比,給出是否為其中某一個人,或者給出排序結果,即人臉檢索。1:N用於用戶不需要聲明身份的場景。根據人臉數據的採集方式,光線條件,配合與非配合,各種人臉識別技術的成熟度差異很大。
4.技術指標
? FAR:False Accept Rate,錯誤接受率,指將身份不同的兩張照片,判別為相同身份,越低越好
? FRR:False Reject Rate,錯誤拒絕率,指將身份相同的兩張照片,判別為不同身份,越低越好
這兩個指標有明確的物理意義,FAR決定了系統的安全性,FRR決定了系統的易用程度,在實際中,FAR對應的風險遠遠高於FRR,因此,生物識別系統中,會將FAR設置為一個非常低的範圍,如萬分之一甚至百萬分之一,在FAR固定的條件下,FRR低於5%,這樣的系統才有實用價值。
騰訊的人臉識別演算法在實際互聯網金融場景測試,自拍-身份證縮略圖對比達到0.01%錯誤率,通過率95%
速度指標
? 支持最小人臉尺寸64x64
? 人臉特徵尺寸1-2KB
? 1:1人臉對比500ms
5. 常見的應用場景
門禁系統:受安全保護的地區可以通過人臉識別辨識試圖進入者的身份,比如小區、學校、企業等。敏感地點也可以使用人臉識別門禁,未登記人員訪問將觸發報警。
攝像監視系統:在例如銀行、機場、體育場、商場、超級市場等公共場所對人群進行監視,以達到身份識別的目的。同時疑犯布控追蹤也是較為常見的應用場景。
學生考勤系統:香港及澳門的中、小學已開始將智能卡配合人臉識別來為學生進行每天的出席點名記錄,內地高校也進行了有關試點。
娛樂應用:自動美妝美圖、人臉屬性識別、顏值分析,都是已經成熟使用的娛樂場景。
網上流傳的一份人臉識別技術排行榜。各個公司的側重點不同,僅僅就人臉識別做了一個排名。
有一些公開的測評數據和應用情況
Emotient
Emotient 獲得 600 萬美元 B 輪投資(2014/03/10)
Emotient 起源於加利福尼亞大學的 「機器感知實驗室」(Machine Perception Lab),他們最終的目的是打造一套 「無所不在」 的人類情感分析系統。
分析表情並不需要特別的硬體設備,至少 48 像素的、從耳朵到耳朵的全臉圖像就能滿足。
- Emotient 同時還提供 API 介面,能夠將其技術輕鬆地與任何硬體或者軟體進行整合。目前,Emotient 已經將其服務與 Google Glass 搭配,開始進行私密的測試。
- Emotient 也將同時作為英特爾RealSense 技術SDK 的一部分,來迅速的與世界上的開發者進行對接。
Emotient 已經將其表情識別服務部署到了零售行業,通過對顧客感受的實時分析,幫助零售業主提升銷量。
Emotient利用人工智慧掃描人臉,然後可在數秒鐘內解讀出他們的面部表情所代表的意義,這種技術過去主要是幫助廣告商和銷售人員判斷消費者對廣告或產品的反應。
Emotient創始人、首席科學家瑪麗安·巴利特(Marian Bartlett)解釋了其工作原理。她說:「首先需要抓取面部照片,然後對其進行掃描。一旦發現這些面部照片後,它就會利用識別技術識別出面部表情。」
Affectiva
成立於 2009年 的 Affectiva 是一個基於雲端的面部情緒識別解析服務公司,通過面部動作編碼(Facial Coding)——捕捉識別對象的面部動作如皺眉、挑眉、傻笑、微笑等等判斷人們的情緒。目前還主要用於市場營銷,但 Affectiva 下月會面向第三方開發者推出其 SDK 開發工具。
埃及科學家Ranael Kaliouby了。她現居波士頓,2009 年成立公司Affectiva,許多員工都來自於M.I.T.
Affectiva坐落於馬薩諸塞州沃爾瑟姆市,在雙行道沿街商業區後的辦公園區,是波士頓模仿矽谷而建立的走廊地帶的一部分。
裝有Affdex的iPad,被簡化成一個能追蹤四種情緒的「分類器」:開心,疑惑,驚訝和厭煩。用這個軟體在臉上掃描一下就能辨別出情緒;如果同時有多張臉,它就會將其分開,一個一個來。然後,識別臉上的一些主要部位——嘴巴,鼻子,眼睛和眉毛——將像素點分別歸位到每個部位,再用簡單的幾何模型渲染特徵。
ffedex一直被當做一種可靠的情緒推測工具——能夠進入潛意識領域的工具。
- Affdex已經做了8萬次皺眉試驗。她站在台上公布結果時說:「我們的正確率能達到90%」。
她的公司已經分析了200多萬個視頻,受試者來自全球80多個國家,在Affectiva初創的時候,她就已經用了幾百個表情訓練她的軟體
Affectiva有賴於Paul Ekman的研究成果。他是一個心理學研究者,他是在六十歲開始研究並建立了權威的理論體系:人類至少有六種普遍的表情,這些表情不論性別,年齡,或是文化背景,都會在每個人的臉上一模一樣地呈現出來。Ekman致力於解密這些情緒,他把它們分解成46個獨立動作,稱其為「動作單元」的結合。把它們分為可變形和不可變形的點,將這些不可變形的點作為錨點,能夠幫助我們判斷其他點移動的距離。
面部識別解析服務 Affectiva 將推 SDK 包,希望在市場營銷以外的領域如遊戲、教學等發揮作用
Affectiva 研究發現,人們對廣告做出的反應——表情數據可以用來預測銷量,精確度達 75%,雖然這僅比傳統的市場調研方式準確率僅提高了 5%。
Affectiva 已經在全世界各地收集了 10 億多個面部表情
此前它已獲得總計 2020 萬美元的投資(李嘉誠參與過其投資),共有員工 35 名。(13年數據)
McCann(Affectiva在巴塞羅那)
McCann分部沒有幫這個俱樂部制定出一個廣告作戰計劃,而是建議它在座位上安裝一個像Affdex的軟體,並允諾觀眾劇院免費對外開放,但是,每笑一次要收取0.3歐元,上限是80次。如果觀眾試圖掩蓋笑容,或是隱瞞笑的次數,就要收取全票價:24歐元。這家店的營業額一下子就上來了。美國,法國及南非的劇院都聯繫McCann,希望能了解到更多方法。
Face++
清華創業團隊推出人臉雲識別開放平台 Face++
Face++ 團隊成員除了幾名來自清華校友外,還有來自美國哥倫比亞大學、英國牛津大學和美國南加州大學的科研及開發人員。
API總調用量超過60億次
並且在金融、安防、零售領域分別開始了商業化探索成功發育出Face++Financial,Face++Security,Face++BI等垂直人臉驗證解決方案產品。
支付寶將會亮相它的新功能——聲波支付+人臉支付。其中比較值得關注的是人臉支付技術——Face++。
魔漫相機是全球首款將真人拍成幽默漫畫的手機應用,用戶數超過2億,通過Face++對人臉自動捕捉和人臉關鍵點檢測技術並結合表情遷移以及圖像融合技術生成用戶私人漫畫形象,打造用戶百變造型。
相關技術:人臉檢測、追蹤,人臉關鍵點檢測
美顏相機是一款專為愛自拍的女生量身定製的美圖軟體。Face++為美顏相機提供領先的人臉檢測和關鍵點檢測技術,在圖像中精準定位人臉和五官位置,讓多款細膩的人像特效瞬間呈現,讓用戶快速擁有驚艷的面容。
相關技術:人臉檢測、追蹤,人臉關鍵點檢測
MeituKiss超級自拍神器手機,前置攝像頭搭載自動美顏技術。Face++為該款手機提供領先的人臉檢測和關鍵點檢測技術,實現實時美顏,自動美肌,智能美型,極致美瞳。
相關技術:人臉檢測、追蹤,人臉關鍵點檢測
這位美女是誰?她長的好像那誰誰?360圖片搜索告訴你!基於Face++提供的人臉搜索技術,360最新推出了一款線上產品——美女魔鏡。只需輕輕一點,360圖片搜索就可以迅速且準確地找到她,並結合百科給出她的信息。
相關技術:1:N人臉識別,大規模人臉搜索
如何在婚戀網站茫茫人海中找到中意的那個TA?Face++幫你篩選!Face++為世紀佳緣提供先進人臉搜索及匹配技術,結合海量資料庫,尋找與用戶上傳照片最相似的異性人臉,讓人臉搜索技術來幫你!
相關技術:大規模人臉搜索
美圖秀秀是一款國內知名的圖片處理軟體。Face++為美圖秀秀提供領先的人臉檢測和關鍵點檢測技術,在圖像中精準定位人臉和五官位置,從而進行人像美白、五官美化等處理,讓人像瞬間美麗升級,更具吸引力。
相關技術:人臉檢測、追蹤,人臉關鍵點檢測
烏鴉來了是一款iOS體感交互遊戲,使用前置攝像頭捕捉玩家的頭部動作進行遊戲操控,是iOS平台上第一款頭部操控的體感遊戲。烏鴉來了是一款iOS體感交互遊戲,使用前置攝像頭捕捉玩家的頭部動作進行遊戲操控,是iOS平台上第一款頭部操控的體感遊戲。
相關技術:人臉檢測、追蹤
Face++開發者Ye Tian開發的一款娛樂產品,已超過30萬用戶。「有沒有想過,為什麼你和你的爸媽長得一點都不像?為什麼你的兒子女兒和你長得也不像?你確定一定是親生的嗎?用相似臉評分測試你們的長相相似度!絕對準確無誤!
相關技術:1:1人臉驗證
Face++為聯想即將發布的視頻通話軟體提供人臉登陸功能支持。只要對著App簡單一笑,就可以登陸相應的賬號。支持Windows/iOS/Android多個平台。
相關技術:1:N人臉檢測
神州智聯是一家提供互聯網教育服務的科技公司。Face++為神州智聯的遠程教育Android Pad提供用戶人臉登錄和實時身份認證服務,解決互聯網教育的用戶身份確認問題。同時,通過人臉實時認證,還可以統計本人學時,提升教學質量。
相關技術:1:1人臉驗證
內置Face++人臉檢測技術的體感跑酷遊戲,由Face++團隊自行開發。通過手機的前置攝像頭,採用最炫的頭部體感操控。當角色處於高空滑竿等的危險地帶時,玩家需要晃動你的頭部來躲避空中的障礙物才能順利通過。
相關技術:人臉檢測、追蹤
Face++ 團隊介紹人臉識別技術主要有以下幾種基本功能:
1)人臉檢測:從圖片中快速、準確的找到所有的或者有某些特徵的臉。
2)人臉分析:通過人臉,對人的性別、年齡、
情緒的信息進行提取。
3)人臉識別:匹配給定人臉的相似性,或者從成萬上億的人臉資料庫中搜索、返回最相似的人臉索引。
Face++ 不久之後也會提供情緒識別功能。
在推出這個平台之前,他們曾做過一款融合了人臉識別的遊戲《Crows Coming》,有 40 萬用戶體驗了這款 App 遊戲,他們還計劃在 11月15號推出另一款遊戲《Free Skate Xtreme》,這款遊戲模仿《Temple Run》,在其中加入視覺控制因素。
Linkface
全球領先的人臉檢測,
Linkface提供全球領先的人臉檢測、識別技術服務,FDDB人臉檢測公開測試世界第一,300-W Benchmark 準確率世界第一, LFW人臉識別準確率已達99.5%以上。
SenseTime
2014年9月,SenseTime的科學家們首次出征 ImageNet競賽,在大規模物體檢測比賽中以40.7% 的成績獲得世界亞軍,僅次於谷歌的 43.9%;2015年3月,該團隊將此成績提高到50.3%,超越谷歌,達到世界第一的水平,並將這一成果以論文的形式發表在2015年國際計算機視覺與模式識別大會(CVPR)上。
2015年,ImageNet新增了一項視頻物體檢測的任務,比靜態圖像中的物體檢測的難度更高。SenseTime聯合香港中文大學媒體實驗室組成的團隊再次出征。最終,團隊在ImageNet視頻物體檢測競賽中檢測一舉奪得數量、檢測準確率兩項世界第一的成績,以壓倒性的優勢擊敗了對手。成為首個在ImageNet奪冠的中國企業。
SenseTime在2015年年底剛剛完成併購了另外一家人臉識別技術領域的創業公司Linkface。後者也是一匹創業黑馬,同樣擁有諸多超越業界大佬的出色成績單。
公司的研發團隊有超過50多名博士全職任職。該團隊在三大國際頂級機器視覺會議CVPR、ICCV、ECCV上共發表論文超過150篇,在亞洲企業中排名第一。
戴宇榮博士,兩任ICCV(國際計算機視覺大會)領域主席;80餘篇著作發表於頂級會議期刊;韓國科學技術學院(KAIST)終身教職; 2011年KAIST傑出教授;微軟學者。為加入SenseTime而放棄終身教職,因為他更看中SenseTime能將技術轉化為業界實際成果的優勢,以及其在人才和資源方面對於科研的助力;
張偉博士,安徽省高考狀元,本科就讀於清華大學,並於香港中文大學獲得博士學位,曾在Kaggle數據科學家排行榜上排名第六,亞洲科學家中排名第一。放棄對沖基金CTO加入SenseTime。
孫禕博士,本科就讀於清華大學電子系,並於香港中文大學獲得博士學位,人臉識別演算法DeepID系列發明人。超越人眼識別準確率,打敗Facebook。
周斌博士, 中國首位HPC(高性能計算)和GPU(圖形處理器)跨領域研發高級工程師,他是全球第12個NVIDIA CUDA Fellow稱號獲得者,也是目前中國唯一一位獲得此稱號的學者;
邱石博士,清華大學電子系第一名,並於香港中文大學獲得博士學位,2014 年,邱石所在的DeepID-Net 團隊首次參加ImageNet 大規模物體檢測任務比賽中,並以 40.7% 的優異戰績位居第二名,僅次於谷歌。
石建萍博士,微軟學者,谷歌獎學金,香港政府獎學金,從浙江大學到香港中文大學,從本科時代頂級會議CVPR 第一作者Oral 到加入創業團隊。
夏炎博士,微軟研究院計算機視覺博士,中科大第一名,郭沫若獎獲得者。專註深度學習,文字識別。
曹旭東,深度學習專家。清華大學物理系,前微軟研究員。其開發的現象級產品如How Old.net 有數億用戶。該技術廣泛用於微軟產品,如Xbox。
Amscreen
將面部識別技術與傳統廣告板相融合的創舉來自歐洲戶外廣告巨頭 Amscreen,在歐洲四處可見該公司架設的廣告牌。據 TNW 報道,Amscreen 這項大膽創舉已經試運行一段時間了,他們與技術提供方 Quividi 合作,為 「獃滯」 的廣告牌裝上了 「智慧的眼睛」。
Faceshift
基於 Kinect 開發的 Faceshift 能將面部表情實時映射到遊戲中
Faceshift 面部表情捕捉工具,可以幾乎無延時地把你的表面表情實時反饋到 3D 模型中。
Faceshift 可以讓視頻遊戲、聊天以及動畫電影製作變得更快更有趣,也將給遊戲開發商帶來新的機會。事實上面向動畫和遊戲製作者發布的 SDK 已經發布,當然你也可以把它用在其它你能想像到的領域。
小丘機器人
國內首款垂直心理的AI情緒關懷師,給每個人提供隨時隨地的情緒陪伴和積極心理管理服務。
小丘的優勢:小丘是「暖丘」App的關聯產品。
暖丘是目前中國最活躍的普通人的C2C情緒互助社區,暖丘在國內最早專註情緒語料庫,從2014年9月至今目前有500萬優質語料,並迅速增長。競品可以利用公共知識做出AI,但沒有優質語料庫,後期質量提升是重大瓶頸。
飛搜科技
飛搜科技公司是一個以科技創新,自主研發,把機器學習,尤其是深度學習的研究成果應用到人臉識別、圖像識別、視頻內容識別等領域的高科技公司。
- 飛搜的實時人臉識別演算法,在世界公開測試基準數據集Labeled Faces in the Wild(LFW)上準確性高於99.0%,超過Facebook於2014年6月份在同樣人臉數據集上測試後公布的 97.35% 的準確率。
輪「技術實力」,還是要看LFW榜和FDDB榜。face++ 99.5% , 商湯 Deepid3 99.53% , 騰訊 Tencent 99.65% , 百度 Baidu 99.77%,顏鑒(ColorReco)99.64%,北京飛搜科技 Faceall 99.4% ,都是一線了,趕超國外的google 。
輪「融資實力」,商湯科技那是必須膜拜的,造出了不少噱頭,造出來linkface四個美人。輪「推廣實力」,天誠盛業必須提下,搜索任何關於人臉識別的信息,都可以看到天誠盛業。
輪「賺錢能力」,首推廈門瑞為,真正做到了小公司賺大錢,產品從軟體到硬體,真正走到了一線
人臉識別公司有很多,大致分為這幾類:
一類是,專註演算法這塊,主要提供的是API,SDK。有的是自己做成了系統,軟體。
一類是,專註系統、軟體這塊,有針對不同行業的解決方案,不過不一定掌握了核心演算法。
一類是,人臉識別模塊及硬體這塊,比如人臉識別考勤機,人臉識別取款機。
北京:FACE++,商湯科技,北京可信網路有限公司,臉指,麒麟永盛
四川:凌感科技,四川蓉達,雲從科技
廣東:顏鑒科技(ColorReco),洪森科技
杭州:杭州微禾
廈門:廈門瑞為
上海:晶軟,看看智能,騰訊優圖,
開為科技的人臉識別Kiwi FaceX 1.0,基於深度學習,在LFW上的準確率?高達99.69%,躋身行業前列,技術展示:http://kiwiar.com/facex
不服來測~~
我們公司靠臉吃飯,人臉SDK,人臉識別,人臉跟蹤來一套!
歡迎騷擾:QQ:2590718645
郵箱:contact@kiwiar.com
手機:13851749125
微信公眾號: Kiwi-AR
思路一,在LFW,FDDB,WebFace,CAS-PEAL 這些國際榜單上查排名,基本上有核心演算法的團隊都會在上面去刷下排名,大致了解下各家的實力。
思路二,有核心演算法的公司,一般官網上都有在線測試模塊,可以上傳本地圖片實測演算法給大家實測,進行比對。下面是參考鏈接FACE++:人臉檢測 | Face++ 最好的免費人臉識別雲服務
facecore:1 : 1 - 在線演示: 1 : 1,1 : N,視頻識別,實時監控,年齡性別,特徵點
商湯(linkface):Linkface - 全球領先的人臉識別技術服務
顏鑒(ColorReco):顏鑒(ColorReco)
臉指:http://www.facefinger.cn:8000/dashboard/demos/index
飛搜:人臉識別 圖像識別 智能鑒黃識別系統
從技術層面來說,在 @李雷 博士提到的在MS-Celeb-1M 競賽獲獎名單中,有一家連續在世界頂級人臉大賽中獲得佳績的年輕院所—中國科學院重慶綠色智能技術研究院(以下簡稱中科院重慶研究院)。
而在中國科學院重慶綠色智能技術研究院內,做這個事情的就是智能多媒體中心,主要從事模式識別與計算機視覺技術研究,這就是雲從科技的孵化地。
這個中心是雲從科技創始人周曦博士在2011年被中國科學院引進回國時,在導師「計算機視覺之父」Thomas S. Huang的支持下,聯合UIUC和新加坡國立大學建立,除了周曦,還有當時在新加坡國立,現在在360AI研究院當院長的顏水成,可謂是實力雄厚的前沿中心。
今年去年MS-Celeb-1M獲獎者名單上都是中科院重慶研究院-雲從聯合實驗室的成員,其實也就是當時雲從科技成立時,創始人周曦安排留在智能多媒體中心的一批人,專門負責學術研究,而雲從科技則負責科技成果轉化。
不過,學術到產業化還有很長的鴻溝。
正如 @jacky yang 所說,
如果是基於深度學習的人臉識別,還不如把問題改為,誰的數據佔優勢?或者說,誰在某個特定場景下的數據佔優勢。
在人工智慧領域,並不存在某一家廠商在所有領域通殺的情況。
因為人工智慧發展到今天,其技術通用性與成熟度尚未達到完全的標準化。
這實際上導致每個細分場景都需要針對性的去優化技術及設計產品。
而各個廠商由於側重點不同,其技術與產品的傾向就會不一樣。
具體可以查看各個廠商的真實案例來觀察其側重點。
雲從科技的主要案例集中在金融、公安、機場。
代表案例有中國銀行、中國農業銀行、中國交通銀行、中國建設銀行、銀川機場、海通證券、復星集團及博鰲亞洲論壇(瓊海市局)等。
至於刷LFW、FDDB等資料庫,只是實驗室階段的演算法驗證手段,與真實場景應用的差距還有很長的距離。
不用比了,看估值、客戶、技術、產品都是 Face++ 遠遠勝出(只看人臉識別)。
各家客戶選擇方案的時候會做評測的,據我所知 Face++ 參與評測的全部排在第一沒有懸念。
利益不相關,我是網路安全從業者,認識部分他們創始人。這必須要匿名,看不看得懂就不知道了。
在G行業的應用中
獲得所有數據的只有一家公司:Y1
而目前所有的「大」一些的宣傳稿,見過的無不是出自這個系統
G省省廳採用了一種PK的方式同時在一個系統中集成了幾個公司的演算法,使用的數據是一樣的。這有效的控制了變數。
就這幾個月的使用結果來說
個人認為S公司和Y1公司是站在第一梯隊的
Y2稍差一些,但是在H市獨自開發的系統卻又一枝獨秀
F公司和G公司在pk系統中真是慘不忍睹
所以個人認為排序應該是Y1,S,Y2,F,K,
以上。
做演算法的不算最牛逼,最牛逼的是能夠做出一套成熟並且魯棒性強的demo。
目前所謂的人臉識別,其本質是通過演算法輸出一個相似度。
比如 張震和吳彥祖的相似度,比如攝像頭裡的我和畢業照上的我的相似度。
那麼我問一個問題,相似度到多少可以認為這兩個人是一個人?
只要拍攝角度,光線,遮蓋物稍微有點變化,都會導致相似度有較大變化(動不動百分之幾十的偏差)。
其實壓根就沒法通過相似度來決定這兩個照片是同一個人。
所以目前的人臉識別不能算真正的識別,僅僅是相似人臉而已。
雖然做不到真正的識別,但是做一些其他的用途還是蠻好的呀,比如美顏,比如視頻直播加上有趣特效。
我是負責NEC人臉識別中國區的,說一下我個人觀點:一個成功的人臉識別項目,
演算法50%+現場調試30%+環境控制10%+客戶預期控制10%。
如果說第三方權威測試還是要看NIST。很多項目要提供該測試的證明材料,方可參與投標。
至於國內那些演算法和廠商,的確在UI方面『客戶方面做得不錯,演算法是有門檻,是一個持續優化的過程,所以斷時間還很難超過國外廠商,但是中國的互聯網技術、大數據技術,包括中國的海量人口樣本,當然要有效的樣本,預計幾年內肯定要超過的。
在中國大的項目仍然在政府和公安,一些小廠商號稱人臉識別很牛,其實也就做過幾個門禁、VIP識別的項目,不成規模,沒有量,怎麼賺錢。
國內做演算法的不知道多少家,而真正有產品且有實際應用的幾個手指就數得出來了……
推薦閱讀:
※數學裡的 e 為什麼叫做自然底數?是不是自然界里什麼東西恰好是 e?
※沙漠應不應該植樹造林?
※牛為什麼會哭?
※生物的演化速度到底有多快?
※有什麼證據可以證明太陽上有碳基生命或硅基生命的存在或是能說明不可能存在?