Rethinking Feature Discrimination 中LFW刷到99.86怎麼看?
這篇文章(coco-loss)其實是這一波做feature normalization文章的第一篇,只是一開始不順利投IJCAI被拒,後來改投NIPS被接收了。
這一波用normalize的文章從coco-loss[1]開始,後來出現了只normalize feature的l2-softmax [2],然後再是我的normface [3],後來又有一篇把featureweight normalization解釋為von-Mise Fisher mixture distribution的文章[4]。其中[1][2][4]在損失函數形式上都一模一樣,但前後差距都不久,算是同期工作,也不存在再發一遍的問題。
用MS-Celeb在LFW上刷到99.86%還是很需要功力的,不得不佩服商湯的調參能力和計算資源。但現在的研究方向都是怎麼加angle margin了,大家還是趕快去研究sphereface[5]吧!
[1][1702.06890] Learning Deep Features via Congenerous Cosine Loss for Person Recognition
[2][1703.09507] L2-constrained Softmax Loss for Discriminative Face Verification
[3]L2 Hypersphere Embedding for Face Verification
[4] Application to Face Verification
[5]Deep Hypersphere Embedding for Face Recognition
更新:
ps:我最近還會在github上寫一篇關於 《為何同時normalize featureweights(coco_loss)會work》的理論推導,歡迎關注我的github主頁:KaleidoZhouYN (Yinan.Zhou)
==============================================
評論中Cheung Tim提到的對齊造成的bias,其實也說明了對齊的重要性(如果是走alignment--&>feature extraction這套流程),coco_loss所使用的RSA對齊方式(sciencefans/RSA-for-object-detection),可以和一般論文中所使用的MTCNN對齊方式(kpzhang93/MTCNN_face_detection_alignment)對比一下,就會發現RSA在遮擋和大角度人臉下相較MTCNN的魯棒性,也就是說你用RSA就能成功識別某些大角度側臉的情況,而使用MTCNN卻不能,這也是為什麼其在LFW上分數高的原因之一。而至於其在MegaFace上76%的準確率,一點也不覺得奇怪,畢竟是一個單網路模型,而且MegaFace關於對齊有非常玄學的東西- -||。
至於Cheung Tim提到的不對齊,走的是faceNet不採用landmark直接用CNN來學對齊的那套(face detection-&>feature extraction),這個很好,但是目前關於這個方向研究的論文比較少,還是走face detection-&>face alignment -&>feature extraction的論文比較多,主要是兩個原因:
一是這樣好訓(感謝Cheung Tim大神的指點,已成功在caffe上實現faceNet那套不對齊的方法,但是真的很難訓),在CASIA上不到1個epoch便能夠看到明顯的收斂效果;二是這樣的話可以排除其他因素的影響,比較容易控制loss function的選擇。
說漏了一點,作者還對MS_Celeb_1M進行了數據處理,個人感覺除了基本的數據清洗應該還做了調整樣本比例的工作。
====================================================
原回答:
coco-loss本身並沒有什麼好說的,你可以看文章中的softmax的baseline,99.75,同樣很高。LFW達到99.86不是光靠調個loss function就能實現的。如果你真正看過lfw的錯誤樣本,其中涉及到了很多墨鏡,表情,大角度的樣本。這些東西,只有靠良好的對齊(face alignment)才能解決。在github的issue上面,我曾經問過作者關於對齊的問題(現在被我closs)了,作者回答換了種對齊方式之後在lfw上面就只有普普通通的99.5了,可見對齊影響之大。對齊在訓練集和測試集兩個方面的影響都是提高LFW最後幾點精度的關鍵,具體我就不明說了
推薦閱讀:
※如何區別維吾爾、哈薩克、烏茲別克、柯爾克孜等民族?
※如何評價ECCV2016中提出的center loss?
※很多圖片識別為什麼將彩色圖像灰度化?
※求人臉識別FRVT和LFW最新的排名,最主要是國內的。?
※人臉識別技術是否可以用來發現被拐賣小孩?
TAG:人臉識別 |