商湯及聯合實驗室37篇論文入選ECCV 2018

商湯及聯合實驗室37篇論文入選ECCV 2018

36 人贊了文章

9月8日-14日,備受矚目的2018歐洲計算機視覺大會(ECCV 2018)在德國慕尼黑召開, ECCV兩年舉辦一次,與CVPR、ICCV共稱為計算機視覺領域三大頂級學術會議。ECCV今年錄用論文700多篇。

商湯科技及聯合實驗室37篇論文入選ECCV 2018

根據ECCV 2018宣布的最終結果,商湯科技及聯合實驗室共有37篇論文入選,超過微軟、谷歌、Facebook等科技巨頭。

商湯科技ECCV 2018錄取論文在以下領域實現突破:大規模人臉與人體識別、物體檢測與跟蹤、自動駕駛場景理解與分析、視頻分析、3D視覺、底層視覺演算法、視覺與自然語言的綜合理解等。這些新穎的計算機視覺演算法不僅有著豐富的應用場景,使得更多的智能視覺演算法能應用於日常生活之中,還為後續研究提供了可貴的經驗和方向。

例如,商湯入選ECCV 2018論文《人臉識別的瓶頸在於數據集雜訊(The Devil of Face Recognition is in the Noise)》中,對於現有人臉數據集中的標籤雜訊問題進行了深入研究,對MegaFace和MS-Celeb-1M數據集中的雜訊特性和來源做了全面的分析,發現乾淨子集對於提高人臉識別精度效果顯著

再如入選論文《量化模仿-訓練面向物體檢測的極小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一種簡單而通用的框架—量化模仿,來訓練面向物體檢測任務的極小CNN模型。作者提出聯合模仿與量化的方法來減小物體檢測CNN模型的參數量實現加速。在有限計算量的限制下,該框架在Pascal VOC和WIDER Face數據集的物體檢測性能均超越了當前物體檢測的先進水平。

而在幾個月前舉行的CVPR 2018會議上,商湯科技、香港中文大學-商湯科技聯合實驗室以及其他商湯科技聯合實驗室共有44篇論文中稿,商湯科技今年累計入選計算機視覺頂會論文數量達到81篇!

商湯科技聯合創始人、商湯研究院院長王曉剛表示:商湯始終堅持對原創技術的極致追求,正是這種精益求精的精神讓商湯在諸多計算機視覺前沿技術領域上不斷取得新突破,也在行業應用方面全面落地。本次會議,華人入選ECCV 2018 的論文數量非常搶眼,近年來華人學者們對原創研究孜孜不倦的堅守,鑄就CV技術領域的一股新力量。

參加COCO 2018和VOT 2018均奪冠

商湯原創技術的不斷進步也在重要的比賽中得到驗證。在2018年的COCO比賽中,商湯科技研究員和香港中文大學-商湯聯合實驗室同學組成的團隊,在最核心的物體檢測(Detection)項目中奪得冠軍。

香港中文大學-商湯聯合實驗室團隊MMDet在COCO 2018的Detection項目奪冠

在此次競賽中,商湯糰隊創造性地開發了三項全新的技術,獲得了大幅度的性能提升:

  1. 新的多任務混合級聯架構(hybrid cascade)。通過把不同子任務進行逐級混合,這種新架構有效地改善了整個檢測過程中的信息流動。
  2. 通過特徵導引產生稀疏錨點,而不是使用傳統的規則分布的密集錨點。這種特徵導引的方案使得錨點的投放更為精準,平均召回率提升了超過10個百分點。
  3. 採用一種新型的FishNet網路結構,它有效地保留和修正多個尺度的信息,能更有效地用於圖像級,區域級,以及像素級預測任務。

在test-dev上,商湯糰隊對上述框架進行了全面測試,其中單模型和多模型(最終提交的結果來自於五個模型混合的框架)的mask AP分別達到了47.4% 和49.0%,比去年冠軍(也是商湯糰隊獲得)的結果,44.0% 和 46.3%,有約3個百分點的明顯提高。 在傳統的基於檢測框的指標bbox AP上,這個新的框架也分別達到了單模型54.1%和多模型的56.0%的性能,比去年冠軍的結果,50.5%和52.6%,也有較大的提升。

值得一提的是,為了推動視覺檢測技術的進一步發展,在ECCV期間,香港中文大學-商湯聯合實驗室還開源了檢測庫mm-detection(github.com/open-mmlab/m)。這個開源庫提供了已公開發表的多種視覺檢測核心模塊。通過這些模塊的組合,可以迅速搭建出各種著名的檢測框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各種新型框架,從而大大加快檢測技術研究的效率。

此外,商湯科技團隊還參加了視覺目標跟蹤大賽VOT Challenge,並在實時跟蹤項目獲得第一名,這一成績體現了商湯在視覺目標跟蹤技術的新突破。

VOT Challenge是視覺目標跟蹤領域一年一度的國際權威比賽,其為跟蹤領域提供了精細的數據標註和評測方式,並在2017年引入了實時比賽:被評測演算法在跟蹤物體的同時必須保持至少60fps跟蹤速率,來模擬現實場景中的跟蹤情況。

今年的VOT 2018在ECCV 2018期間舉辦,共有72隻隊伍參賽,包括微軟亞洲研究院、牛津大學等知名企業與高校。商湯科技的參賽演算法能夠在60FPS的速率下獲得精確的跟蹤結果,並且在其他兩項項目(普通跟蹤和長時跟蹤)也獲得了驕人的成績。

舉辦新型大賽 推動人工智慧行業發展

商湯不止於在頂級計算機視覺大賽上獲得好成績,還致力舉辦行業大賽,制定行業標準,推動人工智慧行業發展。

今年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰賽獲得圓滿成功。作為一項全新的全球頂級計算機視覺競賽,共吸引來自世界各國超過400支隊伍報名。

商湯作為主辦方制定了全新標準數據集——WIDER Face人臉檢測數據集、WIDER Pedestrian專門用於行人檢測的大規模數據集和WIDER Person Search人物檢索數據集,促進高性能演算法湧現。

WIDER Workshop現場

參賽隊伍既有中科院計算所、微軟亞洲研究院、北京大學、上海交通大學、中國科學院大學、中國科學技術大學、NtechLab、卡耐基梅隆大學、香港大學、香港理工大學全球頂尖學府和研究機構,也有雅虎、京東、曠視、科大訊飛、滴滴等科技公司。

未來,商湯將繼續賦能AI創新大賽,加速推進以人工智慧為核心的創新技術,帶動行業應用和產業融合的持續深入。


推薦閱讀:

資本正在流向AI哪些領域,自動駕駛與AI晶元又發生了什麼讓人摒住呼吸? | AI Weekly
我潛入清華神秘實驗室,用腦機介面寫了兩句詩。
GET2017|艾耕科技韋嘯:人工智慧、大數據應該與教育更好地融合
從《仙劍奇俠傳》到《未來簡史》:人工智慧升級之路
【兩分鐘論文】專門反制DeepFakes的AI出現了

TAG:人工智慧 | SenseTime | 計算機視覺 |