湯曉鷗團隊的DeepID網路的訓練問題??

"Deep Learning Face Representation from Predicting 10000 Classes"這篇論文訓練的時候是要訓練60個CNN嗎?論文中說訓練數據分為60個patches,那每個patch中只包含一個人臉的一個區域還是每個patch中包含所有人臉子區域?


按照論文Deep Learning Face Representation from Predicting 10,000 Classes裡面的意思,就是需要訓練60個ConvNets,每個patch訓練1個ConvNets,訓練完成60個ConvNets後提取特徵的時候每個patch和patch的水平翻轉分別提取一個160維的特徵向量。一張人臉照片DeepId最終的特徵為160*2*60


看了李源同學的回答。感覺有點問題。 現在才看DeepID的論文,感覺你的理解好像不太正確。除了五個面部特徵之外還有,5個全局特徵,你漏掉了。應是5個局部特徵+5個全局特徵=10個全局特徵,在×3個尺度得到30個Patch。然後 又分為RGB和GRAY兩種圖片輸入。所以,一共是60個Patch.


推薦閱讀:

CNN為何偏向民主黨?
如何看待8/19CNN暗示非裔是重型犯?
為什麼有些中國人對西方主流媒體抱有敵意?
如何評價特朗普認為 CNN 向全世界糟糕的展示了美國以及 CNN 的反應?
為什麼左翼媒體的主持人普遍顏值高於右翼的?

TAG:美國有線電視新聞網CNN | 深度學習DeepLearning |