CVPR 2018 Person Re-ID相關論文

04-04

CVPR2018的文章估計不少，先搜集了幾篇，先睹為快，保持更新~

1. Pose Transferrable Person Re-Identification

2. Deep Spatial Feature Reconstruction for Partial Person Re-identification: Freestyle Approach 【paper】

3. Adversarially Occluded Samples For Improving Generalization of Person Re-identification Models 【paper】

4. Harmonious Attention Network for Person Re-Identification【paper】

5. Dual Attention Matching Network for Context-Aware Feature Sequence based Person Re-Identification 【paper】

6. Transferable Joint Attribute-Identity Deep Learning for Unsupervised Person Re-Identification 【paper】

7. Camera Style Adaptation for Person Re-identfication【paper】【github】

8. Image-Image Domain Adaptation with Preserved Self-Similarity and Domain-Dissimilarity for Person Re-identification【paper】

9. Person Transfer GAN to Bridge Domain Gap for Person Re-Identification 【paper】

DataSet【Baidu】（password: tkdr）【Google】

10. Unsupervised Cross-dataset Person Re-identification by Transfer Learning of Spatial-Temporal Patterns【paper】【github】

11. Mask-guided Contrastive Attention Model for Person Re-Identification

>> 簡要介紹

1. Pose Transferrable Person Re-Identification

來自上海交大的一篇文章

演算法要點：

一種Data Augment方法，通過引入Pose樣本庫，藉助GAN進行多姿態的標籤樣本生成，用於輔助訓練（可以用在其他領域）。

提出了一種基於姿態遷移的Re-ID框架，包括3個Key Point：

1）通過將MARS數據集進行姿態轉換，得到姿態豐富的訓練樣本，並加入到目標數據集進行訓練；

2）在傳統的GAN的Discriminator（辨別器）的基礎上，提出了一個引導子網路，生成更滿足Re-ID Loss的樣本；

網路描述為：Generator-Guider-Discriminator

3）提出一種可選的優化過程來訓練

所提出的網路，在沒有可以設計re-id模型的情況下，效果超過了目前的state-of-the-art方法。

GAN在行人樣本生成上已有成功的應用（鄭良組），但是有幾個問題：

1）生成樣本不具有足夠的辨識信息，對於模型訓練幫助不大；

GAN只試圖產品視覺上好看的圖片。

2）複雜形狀的生成，產生嚴重的扭曲，有些背離真實；

? 輔助標籤樣本生成

Appearance + pose -> Transfer–> Augment Samples

加入Guider，通過ReID的loss來約束生成的Samples。這個想法雖然簡單，但是有效。

數據訓練：

通過將生成的數據加入到訓練集中，進行ReID模型訓練，這樣對於每個instance，都存在更多的姿態（表達能力更強），當然這樣做的缺點在於通過GAN得到的模型本身不能正確的表示目標，如果過多使用，可能會導致準確度下降，為了避免這個問題，採用軟標籤（soft labeling）的形式來標記生成對象，即按照一定的概率進行Label的分類，不具體展開。

實驗效果：

可以看到，在多個數據集上都有提升，是個不錯的思路！

下一步的提升方向可以考慮更好的樣本生成方法，這個應該是沒有止境的。

2. Deep Spatial Feature Reconstruction for Partial Person Re-identification: Freestyle Approach

來自自動化所孫哲南組

主要針對 partial re-id問題，有遮擋的情況下的重識別問題。

演算法通過CNN網路進行圖像空域重建，得到與輸入圖像尺寸一致的空域特徵圖，不需要特徵對齊過程，演算法借鑒字典學習中重建誤差來計算不同的空域特徵圖的相似度。

卷積網路與空域特徵圖重建

與Triplet類似，採用End-to-end的訓練方式，提高來自同一個id的樣本相似度，降低不同id圖像相似度。

演算法在 Partial REID，Partial iLIDS 上的曲線相當不錯（下圖紅色）。

False Positive曲線

3. Adversarially Occluded Samples For Improving Generalization of Person Re-identification Models

來自自動化所黃凱奇組

演算法提出採用對抗網路（GAN）來生成遮擋樣本，由於生成的樣本能夠屏蔽掉原來的一些特徵，從而導致網路去學習另一部分特徵，由此可以挖掘出一些潛在Feature。

借鑒了 Hard Mining 的思想，思路比較簡單，感興趣的可以復現一下。

4. Harmonious Attention Network for Person Re-Identification

來自倫敦大學的工作

文章提出一種輕量級框架： jointly deep learning attention selection

主要貢獻包括：

1）提出了一種新的聯合學習多粒度 Attention Selection 和特徵表示的方法，來優化re-id問題；

據作者了解，這是採用聯合深度學習multiple complementary attention來解決re-id問題的第一次嘗試。

註：可以理解為多個attention model

2）提出了一種 Harmonious Attention CNN（HA-CNN）；

在任意的person boxes內，可以同步學習hard region-level 和 soft pixel-level attention。同時生成re-id的特徵表示，這種表示能夠最大化 attension選擇和特徵判別之間的相關互補信息。

這是通過設計的輕量級的HA 模塊來實現的，通過multi-task 和 end-to-end學習，能夠有效的學習共享re-id特徵表示的不同的attension 類型。

3）提出了一個cross-attension交叉學習機制，進一步提高不同attention selection 和 re-id判別約束的特徵表示之間的兼容性。

HA-CNN網路示意：

在常用數據集上有明顯提升：

HA（hard-region）和SA（soft pixel）在不同Level下的可視化效果：

7. Camera Style Adaptation for Person Re-identfication

來自廈門大學鍾准，鄭良大神參與指導

通過 CycleGAN 完成圖像 style 遷移，這篇文章發布的時間比較長了，可能很多人都看過，不再詳述。

9. Person Transfer GAN to Bridge Domain Gap for Person Re-Identification

北京大學團隊

通過對抗網路實現不同數據集之間的圖片遷移，演算法和 Camera Style 差異性不太大，大概了解一下idea就可以了，比較突出的貢獻是提出了一個大的數據集 MSMT17。

> 數據採集時長約為180小時

> 總共有15個相機，其中12個室外相機，3個室內相機

> 行人框由Faster RCNN機標完成

> 最後總共有4101個行人的126441個bounding boxes

10. Unsupervised Cross-dataset Person Re-identification by Transfer Learning of Spatial-Temporal Patterns

無監督學習，取得了接近監督學習的效果，

可以參考原作者 @夢裡風林【zhihu】

11. Mask-guided Contrastive Attention Model for Person Re-Identification

來自中科院自動化所團隊

演算法基於目標分割的方式，通過去除背景達到比較好的效果，思路並不太新穎，有興趣的童鞋可以看一下。