[計算機視覺論文速遞] 2018-06-15 人臉專場
來自專欄計算機視覺論文速遞38 人贊了文章
導言
這篇文章有4篇論文速遞,都是人臉方向,包括人臉識別、人臉檢測和人臉表情識別。其中一篇是CVPR 2018。
來源:CVer 微信公眾號
編輯: Amusi
校稿: Amusi
前戲
Amusi 將日常整理的論文都會同步發布到 daily-paper-computer-vision上。名字有點露骨,還請見諒。喜歡的童鞋,歡迎star、fork和pull。
直接點擊「閱讀全文」即可訪問daily-paper-computer-vision。
link:
amusi/daily-paper-computer-vision人臉識別(Face Recognition)
《Scalable Angular Discriminative Deep Metric Learning for Face Recognition》
arXiv 2018
Abstract:隨著深度學習的發展,深度度量學習(DML)在人臉識別方面取得了很大的進步。具體而言,在訓練過程中廣泛使用的softmax損失通常會帶來較大的類內(intra-class)變化,並且僅在測試過程中利用特徵歸一化(feature normalization)來計算這些配對相似性(pair similarities)。為彌補差距,we impose the intra-class cosine similarity between the features and weight vectors in softmax loss larger than a margin in the training step,並從四個方面擴展。首先,我們探索一個硬採樣(hard sample)策略的效果。為緩解調整邊緣超參數的人力勞動(human labor),提出了一種自適應邊緣更新策略。然後,給出一個規範化版本以充分利用餘弦相似性約束。此外,我們增強了前一個約束,迫使類內餘弦相似度大於指數(exponential)特徵投影空間中具有餘量的平均類間餘弦相似度。在Labeled Face in the Wild(LFW),Youtube人臉(YTF)和IARPA Janus Benchmark A(IJB-A)數據集上的大量實驗表明,所提出的方法優於主流DML方法並接近最先進的性能。
arXiv:https://arxiv.org/abs/1804.10899
註:感覺這篇論文很硬很硬啊!
人臉表情識別(Facial Expression Recognition)
《Unsupervised Features for Facial Expression Intensity Estimation over Time》
CVPR 2018
Abstract:臉部形狀和人物運動的多樣性是面部表情自動分析的最大挑戰之一。在本文中,我們提出描述表達強度(expression intensity)隨時間變化的特徵(feature),同時對人和所表達的類型不變。我們的功能是適應整體表達 trajectory的多點動態加權組合。我們在幾個都與時間分析面部表情有關的任務上評估我們的方法。所提出的特徵與用於表達強度估計的最先進的方法進行比較,其表現優於其。我們使用我們提出的特徵來暫時對齊記錄的3D面部表情的多個序列。此外,我們展示了我們的特徵如何用於揭示面部表情中人的特定差異。此外,我們應用我們的特徵來識別基於動作單元標籤的臉部視頻序列中的局部變化。對於所有的實驗,我們的特徵證明對雜訊和異常值具有很強的魯棒性,使其適用於各種面部運動分析應用。
arXiv:https://arxiv.org/abs/1805.00780
註:哇!這個feature好棒棒哦!
《Local Learning with Deep and Handcrafted Features for Facial Expression Recognition》
arXiv 2018
Abstract:我們提出了一種方法,將卷積神經網路(CNN)學習的自動特徵(automatic)與由視覺詞袋(BOVW)模型計算的手工特徵(handcrafted features)相結合,以獲得面部表情識別中的最新結果。為了獲得自動特徵,我們試驗了多種CNN體系結構,預先訓練的模型和訓練過程,例如,Dense-Sparse-Dense。融合這兩種特徵後,我們採用local 學習框架來預測每個測試圖像的類別標籤。local 學習框架基於三個步驟。首先,應用k最近鄰模型來為輸入測試圖像選擇最近的訓練樣本。其次,在所選擇的訓練樣本上訓練一對一支持向量機(SVM)分類器。最後,SVM分類器僅用於為其訓練的測試圖像預測類標籤。儘管之前已經將local 學習與手工特徵結合使用,但據我們所知,它從未與深層特徵結合使用。 2013年面部表情識別(FER)挑戰數據集和FER +數據集的實驗表明我們的方法達到了最新的結果。 2013年FER數據集的最高準確率為75.42%,FER +數據集的最高準確率為86.71%,兩組數據均超過所有競爭對手近2%。
arXiv:https://arxiv.org/abs/1804.10892
人臉檢測(Face Detection)
《Precise Box Score: Extract More Information from Datasets to Improve the Performance of Face Detection》
arXiv 2018
Abstract:對於基於R-CNN框架的人臉檢測網路的訓練,如果與 ground-truth相交的 IoUs高於第一閾值(例如0.7),則將 anchor定分配為正樣本;並且如果它們的IoU低於第二閾值(例如0.3)則為負樣本。根據上述標籤訓練人臉檢測模型。但是,本文不使用IoU在第一閾值和第二閾值之間的anchor。我們提出了一種新的訓練策略,Precise Box Score(PBS),來訓練目標檢測模型。所提出的訓練策略使用具有介於第一和第二閾值之間的IoU的anchor,其可以一致地提高人臉檢測的性能。我們提出的訓練策略從數據集中提取更多信息,更好地利用現有數據集。此外,我們還介紹了一種簡單而有效的模型壓縮方法(SEMCM),它可以進一步提高面部檢測器的性能。實驗結果表明,基於我們提出的方案,人臉檢測網路的性能可以持續提高。
arXiv:https://arxiv.org/abs/1804.10743
註:厲害了,不知道將Precise Box Score 應用到通用型目標檢測上,效果會怎樣?
【論文速遞】專題回顧
[1] [計算機視覺論文速遞] 2018-06-13 圖像分割專場
[1] [計算機視覺論文速遞] 2018-06-11
[2] [計算機視覺論文速遞] 2018-06-08
[3] [計算機視覺論文速遞] 2018-06-06
【推薦文章】
[1] GitHub:目標檢測最全論文集錦
[2] 重磅 | 吳恩達的機器學習書籍又雙叒更新啦!
[3] 重磅:TensorFlow實現YOLOv3(內含福利)
[4] [計算機視覺論文速遞] 2018-06-06
[5] 重磅 | TensorFlow學習資料最全集錦
[6] 人工智慧 | 中國計算機學會推薦國際學術刊物/會議
[7] 計算機視覺 | 中國計算機學會推薦國際學術刊物/會議
【刷題筆記】專題
[1] 刷題筆記 | 劍指Offer 03 二維數組中的查找
看完記得點贊喲
推薦閱讀:
※Learning a Hierarchical Latent-Variable Model of 3D Shapes 筆記
※caffe 編譯bug匯總
※NTIRE 2018 超解析度 CVPR Workshop
※SiameseRPN閱讀筆記
※採用HALCON機器視覺軟體及C#語言檢測工件位置的方法 (之二)
TAG:計算機視覺 | 深度學習DeepLearning | 機器學習 |