Rethinking Feature Discrimination 中LFW刷到99.86怎麼看？

01-14

這篇文章（coco-loss）其實是這一波做feature normalization文章的第一篇，只是一開始不順利投IJCAI被拒，後來改投NIPS被接收了。
這一波用normalize的文章從coco-loss[1]開始，後來出現了只normalize feature的l2-softmax [2]，然後再是我的normface [3]，後來又有一篇把featureweight normalization解釋為von-Mise Fisher mixture distribution的文章[4]。其中[1][2][4]在損失函數形式上都一模一樣，但前後差距都不久，算是同期工作，也不存在再發一遍的問題。

用MS-Celeb在LFW上刷到99.86%還是很需要功力的，不得不佩服商湯的調參能力和計算資源。但現在的研究方向都是怎麼加angle margin了，大家還是趕快去研究sphereface[5]吧！
[1][1702.06890] Learning Deep Features via Congenerous Cosine Loss for Person Recognition
[2][1703.09507] L2-constrained Softmax Loss for Discriminative Face Verification
[3]L2 Hypersphere Embedding for Face Verification

[4] Application to Face Verification
[5]Deep Hypersphere Embedding for Face Recognition

更新：
ps:我最近還會在github上寫一篇關於《為何同時normalize featureweights(coco_loss)會work》的理論推導，歡迎關注我的github主頁：KaleidoZhouYN (Yinan.Zhou)

==============================================
評論中Cheung Tim提到的對齊造成的bias，其實也說明了對齊的重要性（如果是走alignment--&>feature extraction這套流程），coco_loss所使用的RSA對齊方式（sciencefans/RSA-for-object-detection），可以和一般論文中所使用的MTCNN對齊方式（kpzhang93/MTCNN_face_detection_alignment）對比一下，就會發現RSA在遮擋和大角度人臉下相較MTCNN的魯棒性，也就是說你用RSA就能成功識別某些大角度側臉的情況，而使用MTCNN卻不能，這也是為什麼其在LFW上分數高的原因之一。而至於其在MegaFace上76%的準確率，一點也不覺得奇怪，畢竟是一個單網路模型，而且MegaFace關於對齊有非常玄學的東西- -||。
至於Cheung Tim提到的不對齊，走的是faceNet不採用landmark直接用CNN來學對齊的那套（face detection-&>feature extraction），這個很好，但是目前關於這個方向研究的論文比較少，還是走face detection-&>face alignment -&>feature extraction的論文比較多，主要是兩個原因：
一是這樣好訓（感謝Cheung Tim大神的指點，已成功在caffe上實現faceNet那套不對齊的方法，但是真的很難訓），在CASIA上不到1個epoch便能夠看到明顯的收斂效果；二是這樣的話可以排除其他因素的影響，比較容易控制loss function的選擇。
說漏了一點，作者還對MS_Celeb_1M進行了數據處理，個人感覺除了基本的數據清洗應該還做了調整樣本比例的工作。

====================================================
原回答：
coco-loss本身並沒有什麼好說的，你可以看文章中的softmax的baseline，99.75，同樣很高。LFW達到99.86不是光靠調個loss function就能實現的。如果你真正看過lfw的錯誤樣本，其中涉及到了很多墨鏡，表情，大角度的樣本。這些東西，只有靠良好的對齊（face alignment）才能解決。在github的issue上面，我曾經問過作者關於對齊的問題（現在被我closs）了，作者回答換了種對齊方式之後在lfw上面就只有普普通通的99.5了，可見對齊影響之大。對齊在訓練集和測試集兩個方面的影響都是提高LFW最後幾點精度的關鍵，具體我就不明說了

推薦閱讀：

※如何區別維吾爾、哈薩克、烏茲別克、柯爾克孜等民族？
※如何評價ECCV2016中提出的center loss？
※很多圖片識別為什麼將彩色圖像灰度化?
※求人臉識別FRVT和LFW最新的排名，最主要是國內的。?
※人臉識別技術是否可以用來發現被拐賣小孩？

TAG:人臉識別 |