[CVPR2018筆記]Embodied Question Answering

[CVPR2018筆記]Embodied Question Answering

來自專欄 CVPR 2018 論文筆記

CVPR 2018 Schedule上的第一篇oral

這篇文章主要定義了一個新的task並給出了一個數據集

任務定義:將一個agent隨機丟進一個房間,向他提出一個問題,這個agent需要自己導航並回答問題。

問題類型,大家可以大致理解下

數據集問題,場景的生成都是用已經存在的method生成的,詳情可以翻閱論文

這個task總體來說對於agent提出了四個要求:

vision,language, navigation, question answering,文章還給出了各個部分的具體結構,很容易理解。

訓練策略


推薦閱讀:

skimage例子學習(七)filters模塊介紹之邊緣檢測的實現
淺談深度學習的技術原理及其在計算機視覺的應用
【小林的OpenCV基礎課 14】進擊的輪廓畫手/凸包
車輛識別(特徵提取+svm分類器)
一日一論文:Instance-sensitive Fully Convolutional Networks

TAG:計算機視覺 | CVPR |