[CVPR2018筆記]Im2Flow: Motion Hallucination from Static Images for Action Recognition

05-22

來自專欄 CVPR 2018 論文筆記

CVPR 2018 ORAL

本文思路很清晰且已讀，具體細節可以看文章，這裡僅僅把總體思路講一下。

用u-net訓練一個模型：輸入是一個靜態的幀，輸出的預測的五幀光流信息，模型在youtube數據集上訓練。

該模型loss分兩部分，一部分是將生成的五幀光流信息與youtube數據集的groundtruch對比，另一部分是將生成的光流信息與真實的光流信息送進某網路（在ucf101上預訓練過的resent）計算歐式距離；前者是要求準確，後者是為了更好保留high-level的動作信息。

最終將rgb和預測的光流作為標準two-stream模型的輸入進行預測。