標籤:

Rethinking Feature Discrimination 中LFW刷到99.86怎麼看?


這篇文章(coco-loss)其實是這一波做feature normalization文章的第一篇,只是一開始不順利投IJCAI被拒,後來改投NIPS被接收了。

這一波用normalize的文章從coco-loss[1]開始,後來出現了只normalize feature的l2-softmax [2],然後再是我的normface [3],後來又有一篇把featureweight normalization解釋為von-Mise Fisher mixture distribution的文章[4]。其中[1][2][4]在損失函數形式上都一模一樣,但前後差距都不久,算是同期工作,也不存在再發一遍的問題。

用MS-Celeb在LFW上刷到99.86%還是很需要功力的,不得不佩服商湯的調參能力和計算資源。但現在的研究方向都是怎麼加angle margin了,大家還是趕快去研究sphereface[5]吧!

[1][1702.06890] Learning Deep Features via Congenerous Cosine Loss for Person Recognition

[2][1703.09507] L2-constrained Softmax Loss for Discriminative Face Verification

[3]L2 Hypersphere Embedding for Face Verification

[4] Application to Face Verification

[5]Deep Hypersphere Embedding for Face Recognition


更新:

ps:我最近還會在github上寫一篇關於 《為何同時normalize featureweights(coco_loss)會work》的理論推導,歡迎關注我的github主頁:KaleidoZhouYN (Yinan.Zhou)

==============================================

評論中Cheung Tim提到的對齊造成的bias,其實也說明了對齊的重要性(如果是走alignment--&>feature extraction這套流程),coco_loss所使用的RSA對齊方式(sciencefans/RSA-for-object-detection),可以和一般論文中所使用的MTCNN對齊方式(kpzhang93/MTCNN_face_detection_alignment)對比一下,就會發現RSA在遮擋和大角度人臉下相較MTCNN的魯棒性,也就是說你用RSA就能成功識別某些大角度側臉的情況,而使用MTCNN卻不能,這也是為什麼其在LFW上分數高的原因之一。而至於其在MegaFace上76%的準確率,一點也不覺得奇怪,畢竟是一個單網路模型,而且MegaFace關於對齊有非常玄學的東西- -||。

至於Cheung Tim提到的不對齊,走的是faceNet不採用landmark直接用CNN來學對齊的那套(face detection-&>feature extraction),這個很好,但是目前關於這個方向研究的論文比較少,還是走face detection-&>face alignment -&>feature extraction的論文比較多,主要是兩個原因:

一是這樣好訓(感謝Cheung Tim大神的指點,已成功在caffe上實現faceNet那套不對齊的方法,但是真的很難訓),在CASIA上不到1個epoch便能夠看到明顯的收斂效果;二是這樣的話可以排除其他因素的影響,比較容易控制loss function的選擇。

說漏了一點,作者還對MS_Celeb_1M進行了數據處理,個人感覺除了基本的數據清洗應該還做了調整樣本比例的工作。

====================================================

原回答:

coco-loss本身並沒有什麼好說的,你可以看文章中的softmax的baseline,99.75,同樣很高。LFW達到99.86不是光靠調個loss function就能實現的。如果你真正看過lfw的錯誤樣本,其中涉及到了很多墨鏡,表情,大角度的樣本。這些東西,只有靠良好的對齊(face alignment)才能解決。在github的issue上面,我曾經問過作者關於對齊的問題(現在被我closs)了,作者回答換了種對齊方式之後在lfw上面就只有普普通通的99.5了,可見對齊影響之大。對齊在訓練集和測試集兩個方面的影響都是提高LFW最後幾點精度的關鍵,具體我就不明說了


推薦閱讀:

如何區別維吾爾、哈薩克、烏茲別克、柯爾克孜等民族?
如何評價ECCV2016中提出的center loss?
很多圖片識別為什麼將彩色圖像灰度化?
求人臉識別FRVT和LFW最新的排名,最主要是國內的。?
人臉識別技術是否可以用來發現被拐賣小孩?

TAG:人臉識別 |