商湯科技副總裁楊帆:安防行業需要具備強大自我進化能力的AI
近日,由雷鋒網主辦的 AI 盛會 ——2018 中國人工智慧安防峰會,在深圳科興科學園國際會議中心正式舉行。
在會議上,商湯科技聯合創始人、副總裁楊帆對商湯科技在 AI+ 安防領域的相關動態和思考進行了分享。對於AI在安防領域的應用,楊帆表示,人工智慧確實在不斷幫助公安系統提升效率,但在複雜場景下還有提升空間。不斷升級原創技術是優化安防產品的重要手段。同時需要把注意力聚焦在如何讓技術持續獲得進步,只有在演算法、算力、核心平台等方面進行長期性、持續性的積累儲備,才能幫助一家企業走得更遠。
此外,楊帆還強調了自訓練系統在行業實際場景中的重要性,他認為,面對大規模複雜的場景化應用,自訓練系統是唯一的解決之道,它也體現了 AI 的自我進化能力。未來,包括更加精準的人臉識別、人臉行人結合、增量訓練、千億量級檢索,所有這些系統都基於純粹無監督的自訓練系統達成,只有這樣才能夠為 AI+ 安防行業提供最大的價值。
最後楊帆表示,安防是一個非常複雜的系統,每個環節都需要非常專業的理解能力和技能,沒有廠商可以包攬上下游的所有環節。只有各方力量形成合力,才能給客戶提供更有價值的服務。
以下是楊帆演講實錄:
大家上午好!今天很榮幸有機會在這裡聊一聊商湯科技在安防領域所做的事情。
今天談到人工智慧,我們講演算法、算力,其核心還是技術創新。技術通過不斷地向前邁進,並與行業需求相結合,為行業帶來更大的價值空間和核心動力,進而推動 AI 技術真正在一些行業落地,解決我們的實際問題。
每次演講,我都要提到商湯在博士人數和論文發表數量上的優勢,因為它們體現了商湯的核心原創能力。核心原創為什麼如此重要?今天,有人說人臉識別技術已經很成熟了,2014 年計算機人臉識別準確率就超越了人類肉眼,現在 4 年過去了,技術水平已經接近極限。但是,相信在座安防行業的從業者,每天聽到的是」你的產品怎麼識別不準」,」怎麼找錯了」,」是否能在夜光下做更好的識別」等等。今天大家提了很多想法和概念,但是在實際場景中真能做好嗎?AI 技術確實在幫助公安系統持續不斷地提升效率,但是做得還遠遠不夠,仍然有非常大的進步空間,這就是我認為原創技術非常重要的原因。
擁有技術之後,需要關注的是如何讓技術持續獲得進步。只有在演算法、算力、核心平台等方面進行長期性、持續性的積累儲備,才能幫助我們走得更加遙遠。
多維度數據關聯幫助AI應對更高要求和挑戰
第三步是什麼?是對於行業的理解。我們需要對行業有較深的認知,通過不斷跟行業需求磨合,確保技術疊加在正確的方向,確保技術真正能給行業帶來價值和改變。
商湯在技術落地過程中,涉獵很多行業,安防只是一部分。很多人不理解,說你們搞得這麼不專註,精力分散,是否能把事情做好呢?通過這幾年實踐,我們積累了一些獨特的認知。舉個例子,比如說網路視頻廣告業務方面,商湯是目前國內最大的互聯網視頻及直播平台供應商,90% 以上的直播和短視頻分享平台都是我們的客戶。現在,隨著中國視頻直播平台走向全球,在俄羅斯、印度、非洲等地提供服務,商湯作為技術供應商可以通過全球不同地區的人臉數據,來提升人臉識別的技術能力。這種能力用在安防領域,就是提升了技術的適配性,讓產品有了更大的覆蓋性,由此可見看起來毫不相關的視頻廣告業務,也能給安防領域技術提升帶來價值。
另一個例子,商湯還是許多手機廠商的服務供應商,OPPO、vivo、小米、華為等都是我們的客戶,我們提供從前端的視覺感知、圖象優化、智能相冊,到智能認知的全套系統。這些技術能給安防帶來什麼價值呢?它能幫助我們理解,如何讓演算法更小、更快,並在不降低精度的情況下進行演算法優化,讓智能晶元或智能相機具備更加強大的能力。我認為,不同行業之間無論是數據還是技術應用上,最終會產生交叉兼容性,提升這些能力可以幫助我們在真正困難的問題上走得更遠。
當然,光有這些技術還不行,落地需要跟場景進行有效結合,根據客戶的真實需求定義產品。很重要的一點是,思考如何跟行業的上下游廠商共同打造更好的生態,讓 AI 技術給這個行業帶來價值。安防是一個非常複雜的系統,從前端到後端,從相機、傳輸、存儲到智能分析,再到應用反饋、公安實戰需求,每個環節都需要非常專業的理解能力和技能。我認為不會有任何一個廠商,能把這一套的每個環節都做得很好。怎樣才能給客戶提供更有價值的服務?需要所有人共同的合力,大家每人都做自己最擅長的事,形成產業閉環,一同提供更好的服務和更好的產品。
過去的三四年,隨著國家政策支持,我們看到人工智慧技術為安防行業帶來的巨大改變。同時,安防領域也有很多新的需求出現,這些需求對 AI 的分析能力提出了更高的要求和挑戰。比如,在整個場景中利用人臉識別,利用結構化的分析技術進行線索查找、軌跡還原,一人一檔建設等,甚至超越視頻之外的多維度數據之間的關聯,這都對我們提出了新的挑戰。
智能安防領域現在有大量的人臉識別技術落地,從省到市到縣,在各個場景下發揮了重大價值。我一直在想,下一步是什麼?今天安防的市場很大,未來這個市場會更大,之後再下一步是什麼?隨著核心技術能力的提升,未來在更大規模、綜合性的場景,通過由事到人、由人到人、由人到事這些深層次的關聯,進行更加深層次的信息挖掘和關聯性挖掘,將會成為可能。
自訓練系統將決定安防行業未來的高度與寬度
大家都知道商湯技術做得好,2013 年我們提出 DeepID,2015 年 10 月我們人臉識別技術的系統誤報率控制在 E-5 次方量級。2017 年,我們在互聯網金融行業進行手機人臉識別,誤報率是 E-9 次方量級,對於人臉識別準確率的提升是每年兩個數量級。
以抓拍機為例,每天每台平均抓拍的人臉數在 1000-2000 左右,如果希望做到一萬路級別布控,誤報率需要降低到 E-11 次方量級,這樣一天能產生 100 多個誤報。然而,我們通常不是對一天的內容進行搜索,而是三個月一個周期。這樣,如果需要在總共一百天,一萬個攝像頭拍攝的內容中,比較準確地定位出目標人,技術的要求則要更高。
商湯的目標是在人臉識別準確率上,每年保持兩個量級的提升,2018 年要提升到 E-11 次方量級,我認為未來還有更大的提升空間。當然,這裡會存在一個問題,準確率的提升一方面源於演算法的進步,另一方面是得益於不斷累積的數據量。但是,數據累計從一萬提升到十萬非常容易,從一百萬提升到一千萬就很困難,當已經有了十億的數據,如何提升到一百億的數據?這是非常難的。要讓技術提升保持高速,唯一解法是自訓練系統。系統利用業務場景系統中的真實數據進行訓練,並在無監督的情況下進行數據反饋,能增強演算法在實際應用場景的提升,為該場景提供最大化價值。
應用自訓練系統進行技術提升具備如下幾個方面的價值。首先,當面臨更大規模、更加複雜的場景化應用的時候,確保技術有持續不斷的改進空間,能隨著技術積累持續進步。第二,可以避免大量的人工標註,能把性能提升的成本降到最低。第三,來自於業務場景的性能技術的提升,能確保根據演算法得出的解決方案,對於該場景是最佳結果,並能夠定製化地提供解決方案。第四,因為所有的解決方案,最終在客戶那端完成全閉環,可以很好的解決數據安全問題。
如何進行自訓練技術提升過於細節化,今天暫且不講。我來說說訓練結果,在 32GPU 或者 8 卡伺服器上,通過 3 天快速反饋,商湯可以得到精度 96.46% 的世界最好結果,超過 Google NAS 和 MIT Meta-QNN,在這過程中是沒有人工干預的。這樣一套網路結構,如果通過科學家去設計,由人進行迭代和研發可能需要一年時間。
希望未來能有更多真正具備強大自我進化能力的 AI 進入行業,不斷提升 AI 在安防行業的價值,包括更加精準的人臉識別、人臉行人結合、增量訓練、千億量級檢索,所有這些系統都基於純粹無監督的自訓練系統達成。
最後,回到前面講的內容,商湯希望把這樣的一些核心、創新、有價值的技術能力,通過服務的形式標準化、模塊化,並在此基礎上,與上下游的合作夥伴共同打造更加完整、更加有價值的服務生態,最終為安防行業提供更多幫助。同時,希望通過技術的持續創新和改變,讓今天基於事後的,在小範圍、小場景內,孤立零散的抓捕、抓逃應用,未來可以擴展成為綜合的、城市級的整體智能化保障和服務。這是我希望在未來三年或者五年中能達到的目標,謝謝大家。
推薦閱讀:
※【豬臉識別哪家強?】智能養豬成千萬級別飼養規模殺手鐧
※到世界去·北大培文杯初賽·一篇石沉大海的落選作
※人工智慧未來將擁有人類的感情?你能接受嗎?
※探索「意識」的起源:從RNA世界假說到人類大腦糾纏網路
※TensorFlow 的常用模塊介紹