GAIR大講堂CVPR清華大學專場回顧,4位CVPR論文講者乾貨大爆料

8月19日下午,由雷鋒網(公眾號:雷鋒網)主辦,清華數據派THU承辦的第二期「GAIR大講堂CVPR清華專場」活動圓滿結束,本次活動共吸引來自北京各大高校100多名同學前來傾聽。AI科技評論作為獨家合作媒體也前往活動現場進行了報道。

當日雖酷暑難耐,現場還是座無虛席。部分同學因天氣太熱拿起了人手一份的活動宣傳頁扇風降溫,也沒選擇離開活動場地,這足以看出他們對本次活動的關注熱情。

活動現場

四位分享嘉賓分別是:

清華大學自動化系三年級博士生 段岳圻

Momenta 研發總監&聯合創始人 孫剛

中科大&微軟亞洲研究院聯合培養博士生 鄭賀亮

中科大&微軟亞洲研究院聯合培養博士生 邱釗凡

段岳圻分享的論文題目是:Learning Deep Binary Descriptor with Multi-Quantization (多量化深度二值特徵學習) 他分別從四個方面介紹了他的論文研究:背景介紹,文章方法,實驗結果,參會心得。

圖中「存儲庫圖片特徵」和「特徵匹配」為什麼標註橘紅色了呢?段岳圻介紹道,像訓練模型、提取庫圖片特徵都可以線下花幾個月搞定,而存儲庫里的圖片特徵要一直存儲在雲端里,不然輸入的圖片沒有辦法進行特徵對比。在線部分中的特徵匹配也是需要很多輪的特徵對比和匹配,所以做了重點標註。該論文用的是非監督深度學習方法,非監督或弱監督學習是未來發展趨勢,大名鼎鼎的楊立昆(YannLeCun)教授曾說過,非監督學習是讓機器獲得常識的一個嘗試。

文章方法介紹:深度二值特徵學習因其存儲和匹配的高效性,近年來在學術界持續受到關注。現有的深度二值特徵學習方法採用符號函數對實值特徵進行二值化,未能考慮數據分布,從而導致了較大的量化損失。這篇論文將二值化過程看作非監督多量化問題,提出了基於K-自編碼網路的深度多量化演算法,並將其應用於深度二值特徵學習,提出了多量化深度二值特徵學習,降低了二值化造成的量化損失。實驗結果證明了本文方法的有效性。

最後段岳圻同學也分享了CVPR 2017的參會心得。

第二位分享嘉賓是Momenta 研發總監、聯合創始人孫剛博士,分享題目是:ImageNet冠軍模型SE-Net詳解。

孫剛博士不僅是Momenta 研發總監、聯合創始人,同時還是高性能並行計算系統專家、大規模圖像識別專家、ImageNet 2017 圖像分類冠軍、ImageNet 2016 場景分類亞軍。這篇論文作者提出了一種新穎的神經網路模塊稱為Squeeze & Excitation(簡稱SE),以此大幅提升模型的精度。通過Squeeze 和Excitation操作,SE模塊自動對特徵重新分配權重,增強對識別有用的特徵,而抑制無效或收益甚微的特徵。在引入極少計算和參數量的情況下,將現有絕大多數網路結構的性能大幅提升。

第三位分享嘉賓是中科大&微軟亞洲研究院聯合培養博士生鄭賀亮。鄭賀亮在大四開學時就進入微軟亞洲研究院實習,期間在同一實驗室師兄師姐們的鼓勵下,首次投CVPR論文就被選中。他的論文題目是:Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-Grained Image Recognition(精細化物體識別中基於遞歸注意力模型的卷積神經網路)

近年來,基於弱監督的精細化物體識別問題倍受關注。現存的主流方法分兩種:對於有判別力區域的定位和對精細化特徵的學習。在這篇CVPR文章里,鄭賀亮和其他的作者通過設計一種RA-CNN的網路結構,將不同尺度的重要區域綜合起來進行分類,實現了定位和精細化特徵學習之間的相互促進,在精細化物體分類的任務上取得非常理想的結果。

在分享CVPR參會心得時,鄭賀亮同學總結了三點:

「You are not alone」你並不孤單。在實驗室中每個人研究的課題都不一樣,但是到大會上會有很多workshop,每個方向都有很多人研究。你可以找到興趣相同的朋友 ,甚至可以深入討論實驗的細節,有一種彼此相通的感覺。

「Paper is not the end」發表論文並不是終點。到大會上你會發現大牛研究的都是一條線,而不是一個點。他們發的論文只是這條線上的某個點,在研究過程中他們是遵從自己的一個思路的。所以我們在做學術研究時也要慢慢形成自己的方法論,而不僅僅是找到解決問題的方法。

「Research changes the world」科研改變世界。到大會上才能真切感受到自己做的學術研究成果真的可以影響世界,改變世界。

第四位嘉賓是中科大&微軟亞洲研究院聯合培養博士生邱釗凡。他分享論文題目是:Deep Quantization: Encoding Convolutional Activations with Deep Generative Model (基於深度生成模型的卷積層特徵提取整合)

邱釗凡列了一個提綱,從八個方面依次介紹了自己目前所在做的研究方向。

深度卷積神經網路目前在不同的識別問題上體現出優異的性能,而如何從神經網路的卷積層中提取特徵並做出整合分析成為了進行研究的一個基本問題。他的這篇分享的論文中提出了基於深度生成模型的卷積層特徵的提取整合方案,並將最終得到的全局特徵應用在不同分類問題當中。實驗結果表明,在圖片精細分類和視頻動作識別兩個問題上,該方法均體現出較好的性能。

論文介紹完後他也沒有忘記和大家分享參會心得:

圓桌提問環節部分回答內容

AI科技評論:最後問幾個大家比較關心的問題吧,怎樣才能寫出一篇高質量的論文?寫論文的過程中有哪些點要側重,比如演算法,思路這些?

鄭賀亮:我當時也是被同實驗室師兄師姐的科研熱情所感染,盡量以一種積極的心態去做實驗,拿出一種論文必能投中的自信心態去做實驗。在方法上掌握了問題該用什麼辦法去解決,然後總結成一種思路,再賦予它含義,最終寫成paper。

論文的引言(introduction)部分比較耗費精力,要學會講故事不僅要表達清楚自己的觀點和出發點,還要想到別人會有什麼疑問,以及可能引起別人爭論的地方。爭論的地方是否是該論文的缺點,如果是的話,要採用什麼辦法才能解決這個缺點,這個過程是我和小老闆考慮的主要內容,從中也學到了很多東西。

AI科技評論以Momenta 為例,招人的過程中比較看重學生的哪些素質?或者有哪些要求?

孫剛:基本的招人原則就是首先要看科研方向和我們需求的方向是否一致。對於研究方向不是太一致,如果這個人很聰明或者在面試過程中表現出的思維方式是我們所欣賞的,也是可以的。另一個要求就是招的人必須要在某一方向非常強,任何一個方向都可以。Momenta比較青睞有專長的同學。有意願的同學可以給我們發郵件talentoverflow@momenta.ai

AI科技評論(現場觀眾)面試的核心考點是不是演算法?如果演算法能力不是太好怎麼辦?

孫剛:在某方面是不是特彆強是一個方面,另外也不會因為某方面不擅長就完全否定一個人,比如候選人的思維非常活躍,可以根據一個問題提出創新型方案,但編程能力不是太好,這也是沒問題的。我們會通過一個綜合的評定,會根據候選人擅長的部分量身打造一個職位。

AI科技評論:三位都已經發表過頂會論文了,那麼你們在做學術的過程中有沒有遇到過哪些坑,需要提醒大家去避免的?

邱釗凡:我覺得最重要的一點還是要理解你在幹什麼。剛開始做學術你可能會拿到一個項目課題(topic)或者看到別人做一個課題,你也想去做。但是你在做這個的過程中,可能比較重要的一點是在於你是否真的知道這個課題的意義,你做的這個點的提高為你帶來什麼,或者為你的課題帶來什麼。另外需要有一些前瞻性的視野,在你看別人工作時除了看到他們在做什麼,為什麼這樣做之外,還要知道他的這個思路還能用來做些什麼,他的課題方向還可以做些什麼。就算不是自己相關的工作,也可以去思考。

孫剛:我比較認同釗凡所說的。我本科到博士再到工作,最大的進步並不是說自己在科研,技術上的進步,主要還是自己思考問題的方式、邏輯的進步。做學問的時候,自己要仔細考慮一下,我做這個究竟是為了什麼,自己喜歡做什麼,也要根據實際情況,來看一下做的這個事情是否能達成。在做具體事情之前有一個完整的規劃,包括對自己未來職業上的規劃。這些方面,我覺得是比做學問更值得大家思考的問題。

鄭賀亮:我覺得他們說的特別對。選題特別重要,如果你選的不是現實中需要解決的問題,那研究再深也沒有什麼價值。所以說選題還是要慎重考慮,一方面是要結合自己的興趣,另一方面研究的這個確實是社會需要解決的問題。另外研究過程中,不要只為了發現一個方法來研究,而是要總結出一套方法論來,也就是說你的背後要有一個思想一直在指導你,你發的每篇論文都是慢慢地走向你最終的目的。在看別人發的論文也要看到他們背後的那個思想是什麼。

AI科技評論(現場觀眾):如果自己實驗室的方向和深度學習不是太相關,差不多就是一種自學的狀態,怎麼能在這個領域更深入一些,或者如何設計一個自學的路線?

孫剛:我其實也有過一段這樣的經歷,當時我做topic和老闆所研究的也不太一致,這種情況下,自己的成長確實比較慢。在這種情況下,你可能要和老闆商量下,能不能通過實習的形式來和更多的人交流,來改變這一情況。另外,就是要看你自己了,老闆有時要求你必須做的,你也不想做,確實比較痛苦。我們公司有幾個這樣極端的例子,有個同事乾脆就輟學了,他當時學的是物理,他覺得物理要作出一些成果,需要比較長時間的的假設檢驗過程。每個人時間都有限,肯定要挑選一些假設檢驗周期比較短的事來做。當時他就放棄了物理專業,然後從計算機零基礎開始學習人工智慧,現在已經是這個領域非常牛的人了。

AI科技評論為大家整理了本次活動現場PPT下載地址:鏈接:pan.baidu.com/s/1kUIzBW (密碼:xbvt)。另外,8月26日下午2點,雷鋒網「GAIR大講堂CVPR哈工大深圳專場」活動將在哈工大深研院A棟104教室舉辦,名額有限,歡迎報名參加!雷鋒網報名地址:leiphone.com/activity/v

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

原文鏈接:4位CVPR論文講者乾貨大爆料,想要在頂會發Paper 必看!

往期活動視頻回顧地址: GAIR大講堂-AI慕課學院


推薦閱讀:

Action Reconition CVPR 2017
簡單自編碼器實現zero-shot learning (CVPR 2017)--論文筆記
現場報道 | CVPR 2017多個獎項公布:蘋果公司獲最佳論文
多風格生成網路——實時風格轉換
CVPR—II | 經典網路再現,全內容跟蹤

TAG:CVPR | 計算機視覺 |