中國團隊再次稱雄AI大賽,微軟谷歌FB都甩在身後

李林 假裝發自 威尼斯

量子位 出品 | 公眾號 QbitAI

又一次!中國團隊拿下一項AI賽事的多個大獎!

8天的計算機視覺頂會ICCV 2017在威尼斯悄然落幕,期間中國團隊在物體檢測、人體關鍵點檢測等競爭激烈的比賽中擊敗了谷歌、微軟、Facebook等國際巨頭AI實驗室。

ICCV 2017 「Joint COCO and Places Recognition Challenge」 Workshop中,一共公布了7項競賽的結果。

中國AI創業公司曠視科技(Face++)在MS COCO物體檢測人體關鍵點檢測,以及Places物體分割三項比賽中擊敗微軟、谷歌、Facebook等對手,奪得了第一名。

曠視科技獲COCO物體檢測、人體關鍵點檢測冠軍;UCenter獲COCO物體分割冠軍

而在MS COCO物體分割檢測中,由北京大學和香港中文大學聯合組成的UCenter隊(也可以理解為商湯科技隊)奪得冠軍,曠視科技(Face++)團隊獲得了第二名。

Places場景分割挑戰賽的冠軍由中科院自動化所和京東聯合建立的CASIA_IVA_JD隊拿下,第二名是今日頭條的WinterIsComing隊。

參賽選手總結

量子位還得到一份曠視Face++此次參賽主力隊員的一份賽後總結。這份總結應該是出自大三學生肖特特,他還特別提到隊友羅睿軒和姜博睿。轉發如下:

拿獎拿到手軟

終於,可以自豪地宣布,我們Face++團隊在備受關注的MSCOCO和由MIT牽頭的Places比賽中參與四個項目,擊敗Facebook, Google, Microsoft, 國內外高校和企業等,拿下三項世界冠軍一項第二名。其中我作為核心成員之一參與了COCO Detection & Instance Segmentation與Places Instance Segmentation三個項目,並為COCO Skeleton做了一點點微小的貢獻


關於比賽

一支團隊能同事拿下那麼多冠軍是史無前例的。在最重要的COCO Detection中,我們贏了第二名近2個絕對百分點。在Places比賽,我們在準備不充分的情況下(我的錯),贏了第二名Google4.5個絕對百分點。為我們的隊伍感到自豪。


「Face++模式」

對於我來說,贏了是團隊好輸了當然是自己做得不夠好。這次比賽,我特別要介紹曠視的platform組。他們負責維護和建立上千塊gpu的集群,支持各種功能。而我們,動輒要求幾十上百塊gpu跨機訓練,給他們造成了前所未有的壓力。但是,他們每次幾乎立即處理問題,以最快的速度解決。這是我見過的最敬業,效率最高的team. 每一塊獎牌後面都應該有他們的名字。


「姚班模式」

我特別想提一下,在兩個Segmentation比賽中,我的兩位室友,羅睿軒和姜博睿,比我做出了更大貢獻。他們也是我的ACM隊友。這是我一直追求的姚班模式。作為朋友,室友。大家每時每刻、自發地討論學術問題,取得比賽好成績,或者一起發表論文。很高興我在身體力行,為這個模式做了一些微小的貢獻。感謝室友的不殺之恩,因為我實在太push了…把人從床里拖出來review代碼這事發生了不止一次。比賽結束前每天熬夜到三四點,第二天接著干。很不容易,Good job!


關於ICCV

第一次在國際會議做Presentation, 居然上台後一點都不緊張。我要了一個手持麥克風,借了個遙控器,成為了唯一一個不在講台後講slides的人 XD. 被偶像級前輩Ross Girshick誇報告講得非常好,真的特別開心。


關於research

準備今年的CVPR和明年ECCV submissions. 手裡攢了不少東西。借用Kaiming的一句話」漲3個點很容易,漲3個點講個故事也不難,最難的是想一個idea, 並且指出它能漲3個點」. 跟這些人交流得越多,我越來越知道自己應該做什麼樣的工作,什麼樣的工作是有意義的,值得尊敬的。希望在明年ECCV投稿的工作中,能看到自己一點點往這個方向的努力。


有趣的事情

  1. 與Ross和Kaiming聊了一會,我表達了對兩位role models的敬佩,講我一直在向各位學習。Ross大神說你明年要是能來FAIR實習就太好了。我們沒準還能向你學習呢。腦子一下空白了…回答,現在不夠格和各位一起工作,phd時一定一定會申你的intern :)
  2. 三年級本科生的身份倒是能讓大家迅速記住你 23333 真的比平均年齡小了太多。。
  3. 感謝NVIDIA送了一塊TITAN XP。以為還是之前的一萬美元呢哈哈

(插播,此處的Ross和Kaiming,可以參考量子位之前的報道)

另外,據商湯科技透露他們的隊伍也是實習生擔任主力。

歷史戰績

物體檢測這個項目,是MS COCO大賽的重頭戲,從2015年第一屆就存在,第二、三屆中依然延續了下來。

其實,拿下2015年物體檢測項目冠軍的MSRA團隊,就是孫劍在微軟亞洲研究院帶領的一組研究員,包括何愷明、任少卿、代季峰和Xiangyu Zhang,所用的演算法,是何愷明和RBG大神第一次合作的Faster R-CNN。

2016年的物體檢測冠軍,是谷歌研究院的G-RMI隊,而用的演算法,依然是Faster R-CNN。

2015年第一屆MS COCO大賽中除了物體檢測,還有個生成圖片說明(Captioning Challenge)項目,當時奪冠的谷歌團隊,與人類baseline相比依然差了一大截,這個比賽項目也沒能繼續下去。

在2016年,物體檢測之外的比賽項目變成了人體關鍵點檢測,當時奪冠的團隊來自CMU。

COCO+Places 2017簡介

MS COCO是一個已經舉辦了三年,在業內頗有名氣的比賽。今年的MS COCO共有四個項目,包括物體檢測、物體分割、人體關鍵點檢測和場景分割。

和MS COCO聯合公布結果的Places今年還是第一屆,由MIT和CMU牽頭,包括物體分割、場景分割和邊緣檢測三個項目,旨在深度理解圖像場景。

COCO挑戰賽

COCO是一個圖像數據集,被設計用來推動物體檢測研究,特別是檢測上下文中的物體。其中提供的注釋包括80個分類的物體像素級分割,人體實例的關鍵點注釋,91個類別的背景語義分割。

大賽具體包括:

COCO檢測挑戰

COCO 2017檢測挑戰賽已在推動物體檢測領域的進步。參賽隊伍要在兩類物體檢測挑戰中競爭:使用包圍盒(bounding box)輸出或者物體分割輸出。

COCO關鍵點挑戰

這項挑戰需要在複雜環境下對人體關鍵點進行定位。這項挑戰需要在檢測出人體的同時,對關鍵點進行定位標註。

COCO背景語義分割挑戰

今年的挑戰中,已經給出人、汽車、大象等物體的分類,所以重點主要在背景分類的部分,例如草坪、牆壁、天空等。

相關詳情可以訪問:

//cocodataset.org/

Palces挑戰賽

Places挑戰的數據,是一個像素級標註的圖像數據及ADE20K。這個數據集中有2萬張圖像用於訓練,2千張用於驗證,3千張用於測試。

數據集地址在此:

//groups.csail.mit.edu/vi

Places 2017的挑戰主要有三個任務:場景分割(scene parsing)、物體分割(instance segmentation)、邊緣檢測(semantic boundary detection)。

詳細信息可以訪問這裡:

placeschallenge.csail.mit.edu

歡迎大家關注我們的專欄:量子位 - 知乎專欄

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位 QbitAI

?? ? 追蹤AI技術和產品新動態

推薦閱讀:

進擊的DuerOS,開發者的「新黃金時代」
中國人工智慧技術蓬勃發展 | 張薩拉
【西瓜書】周志華《機器學習》學習筆記與習題探討(一)
為什麼小米MIX開始嘗試並未大量驗證的聲學技術?
這些令人驚訝的「恐龍」居然是AI創作的,藝術家們也要面臨失業了嗎?

TAG:人工智能 | 计算机视觉 | 微软Microsoft |