商湯科技與多方聯合舉辦計算機視覺頂級挑戰賽

商湯科技與多方聯合舉辦計算機視覺頂級挑戰賽

52 人贊了文章

近日,由商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(以下簡稱:WIDER Challenge)挑戰賽圓滿落幕。作為一項全新的全球頂級計算機視覺競賽,挑戰賽共吸引來自世界各國超過400支隊伍報名。在競賽組織、設計、數據選取等全過程中,商湯科技充分發揮產學研協同的優勢,提出了諸多切合實際場景及產業應用需求的競賽課題及規則,以全新的行業規範和標準,促進產業與學術界的交流,開拓計算機視覺研究的新發展方向。

制定全新標準數據集 促進高性能演算法湧現

隨著應用需求與場景的增多,人臉檢測、行人檢測及人物檢測已成為計算機視覺研究中的熱門項目。挑戰賽聚焦這三大熱點,設計了WIDER Face,WIDER Pedestrian及WIDER Person Search三項子任務,同時基於不斷增加的複雜場景需求,啟用了更加貼近真實場景的數據集,以提升競賽的實用、創新及挑戰性,進而促進計算機視覺領域人臉及行人檢測高性能演算法的湧現。

WIDER Face人臉檢測數據集是人臉檢測領域中的標準數據集。WIDER Face數據集(mmlab.ie.cuhk.edu.hk/pr)於2016年由商湯-香港中文大學聯合實驗室搜集、標註並作為口頭報告發布在當年的計算機視覺頂級會議CVPR大會上。在一年多時間裡,WIDER Face已成為人臉檢測領域廣泛使用的標準數據集。相比較於之前的人臉檢測數據集,WIDER Face數據集在數據難度,圖片和標註數量上都有一個數量級的提升。

WIDER Pedestrian提供了專門用於行人檢測的大規模數據集。考慮當前行人檢測兩大熱門應用(監控和自動駕駛),選用監控攝像頭和車載攝像機採集的圖片,拍攝角度、行人尺度、光照等方面都具有很大不同,參賽者必須提出更加魯棒和普適性的方法來應對不同場景。並且部分數據來自夜景拍攝,給檢測帶來更大難度。同時,相比其他的行人檢測數據集,WIDER Pedestrian提供了行人和騎車人兩種不同行人的標註具有更多的檢測目標數和不同尺度的行人。檢測目標的密集,更小尺度的行人和行人之間的遮擋等都給參賽者帶來了更多挑戰。

WIDER Person Search是一個新穎的從192部電影中檢索人物的任務,需要根據演員的標準照,從一個大的資料庫中將對應角色的實例全部檢索出來。人物檢索不但具有實用性,還非常具有挑戰性。演員的標準照和他們在電影里的裝扮往往是完全不同的。即使在同一部電影里演員的衣著和環境也會發生極大變化。此外電影里的還存在光線過暗、遮擋、動作模糊等各種增加識別難度的障礙。這個更具有挑戰性的任務為人物搜索演算法的未來發展提供了新的舞台。

全球400餘隊伍參賽 各項目前三脫穎而出

WIDER Challenge挑戰賽共吸引來自全球學術、產業界的432人/隊報名參賽,收到73支隊伍提交結果。參賽者來自中國、俄羅斯、日本、美國、澳大利亞等多個國家。參賽者隸屬的機構既包括中科院計算所、微軟亞洲研究院、北京大學、上海交通大學、中國科學院大學、中國科學技術大學、NtechLab、卡耐基梅隆大學、香港大學、香港理工大學、悉尼科技大學、日本中部大學、美國聖塔克拉拉大學、美國喬治城大學、伊利諾伊大學、慕尼黑理工大學等大學和研究機構,也有京東、雅虎、曠視、科大訊飛、滴滴等商業公司。

面對三個挑戰性極高,同時頗具實用價值的子任務,參賽隊伍們各展神通。WIDER Face人臉檢測任務比賽的三支獲獎隊伍,均使用了深度學習技術來設計實現人臉檢測演算法,並且均使用或借鑒了特徵金字塔的思想對主幹網路的特徵進行增強,並對初始匹配模板(anchor box)進行了分組和重設計。冠軍隊伍還使用了模型融合來取得更好的結果。

在WIDER Pedestrian監控和自動駕駛下的行人檢測任務中,獲勝者使用傳統Faster RCNN方法,利用ResNet網路加金字塔結構(FPN)抽取並融合多層次語義特徵。並通過在檢測模塊中添加級聯網路(Cascade R-CNN),訓練得到更好的檢測框回歸器(bounding box regression),採用RoI-Align代替Faster RCNN中的RoI-Pooling,幫助檢測小尺度行人,使用注意力機制(channel-wiseattention)處理遮擋問題。

在第三項子任務WIDER Person Search中,獲獎隊伍則都把任務拆分為兩個階段,第一個階段做人臉識別,把人臉相似度非常高的加入到查詢集(query expand)。第二階段做行人重識別,利用身體特徵處理人臉特徵無法準確判斷的待查詢圖片。最終綜合人臉和人體的特徵相似度得到排序結果。冠軍和亞軍都使用了傑卡德距離和歐式距離來進行排序。

作為挑戰賽的聯合主辦方,商湯科技並未派隊伍參與此次競賽。挑戰賽頒獎儀式將於今年9月ECCV 2018會議期間在德國慕尼黑舉行,同時還將舉辦相關研討會。此外,全體獲獎者將被邀請共同撰寫競賽論文,並在ECCV2018研討會上做報告。競賽結束後,組織者仍會開放驗證集的測試伺服器供參賽者進行科學研究。

商湯科技秉承「堅持原創,讓AI引領人類進步」的使命,一直以來專註於推動計算機視覺與深度學習技術的發展,不但擁有自主研發的原創深度學習平台Parrots和全球頂級超算中心,是亞洲最大的AI研發基地,同時以產學研協同創新的模式,藉助在人臉識別、圖像識別等技術領域豐富的應用落地經驗,不斷推動學術和工業界的緊密連接。通過舉辦WIDER Challenge挑戰賽,商湯科技以多年研究積累與落地經驗反哺學術,制定全新行業標準,引領產業與學術發展潮流,推動計算機視覺領域技術進步。

推薦閱讀:

商湯科技:圖片雜訊才是人臉識別背後的惡魔
CVPR 2018 |基於孿生區域推薦網路的高性能單目標跟蹤
商湯科技44篇論文入選CVPR 2018
CVPR 2018 | 商湯科技Spotlight論文詳解:RL-Restore普適圖像復原演算法

TAG:人工智慧 | 計算機視覺 | SenseTime |