行人檢測&再識別&搜索

1、Pedestrian Detection

略。

2、Person Re-identification

略。

3、Person Search

其主要考慮,現有大多person re-identification演算法著重於考慮在queries和candidates之間匹配cropped pedestrian圖像,但在現實應用場景中行人邊界框標註是不存在的,即需要從整幅複雜場景搜索目標行人。person re-identification與Person Search差異可由下圖表示(圖片來自下述論文):

person re-identification與Person Search資料庫差異可表示如下:

(1)Pedestrian Detection+Person Re-identification:

即將Person Search任務分開組合Pedestrian Detection+Person Re-identification。對於檢測,可採用DPM、ACF、CCF、faster RCNN等。對於Re-id,考慮特徵表示DSIFT、LOMO、automatically learning features with CNN等以及各種距離度量方式。

(2)End-to-End Person Search:

即聯合優化檢測與識別。

A、Person Search in a Scene by Jointly Modeling People Commonness and Person Uniqueness

其考慮簡單地組合detection和re-id存在兩個問題,一是檢測的錯誤帶入了re-id,二是re-id問題場景本身不同於person search,因此提出對commonness of people(for detection) 和uniqueness of people(for identification)進行聯合優化。

B、End-to-End Deep Learning for Person Search

其結構如下所示,訓練階段整體損失為Anchor smooth L1回歸損失、Bbox smooth L1回歸損失、Anchor是否行人的softmax損失以及person identities的RSS損失之和。

C、Joint Detection and Identification Feature Learning for Person Search

其提出OIM損失函數更有效地訓練網路,其結構如下:

D、Person Search with Natural Language Description

其主要考慮的問題是person search with natural language description,即Searching persons in large-scale image databases with the query of natural language description。給定一個人的文字描述,Person Search演算法要rank all the samples in the person database,然後根據描述檢索最相關樣本。圖示如下:

E、IAN: The Individual Aggregation Network for Person Search

F、And..............


推薦閱讀:

一個 MXNet 實現的 Mask R-CNN.
域名關聯模型:讓惡意軟體自我暴露

TAG:计算机视觉 | 深度学习DeepLearning | 机器学习 |