日記-人臉識別
來自專欄 萌萌的二二
人類大腦本身是一個非常高效的語音和圖像識別系統,認知科學家的結論是光線從入腦到被識別,只需要通過6層傳遞。這個傳遞分析過程,又和現在的神經網路演算法的層層傳遞分析很像,神經網路演算法歷時4-50年,終於在有大量數據和高計算性能的現在被應用。
幾個技術節點:
1 . 室內可見光會因為不同的照射角度,產生陰影,影響識別 --------- 近紅外拍攝技術
2. 強烈的室外太陽光照射,讓人的面部陰影過大,幾乎是黑乎乎的------ 光線預處理技術,處理成統一的類似浮雕的面板
3.海關查驗,人證合一,人的姿態不一,產生識別難度---------- 3D建模技術,然後投出正面的人像照片,把張開的嘴也合上,然後比對
4. 安全、防偽技術,活體識別--------- 比如用照片、視頻、人行面具來偽造和攻擊;初級的是用讓人張張嘴,點點頭來識別,後來有了把一個人的動作移植到另一個人身上的視頻工具,被攻破;後來是採集多圖譜人像,照片和視頻在多圖譜下採集的是白茫茫一片,因為反射率不一樣
5. 其他一些識別難點------比如面部被遮擋,尤其是傳遞信息最多的眼部被遮擋;人的年齡和面容變化;雙胞胎或相似親緣長得像;
--------------
眼部在人臉識別中貢獻的信息最大,和人類直覺很相似,感覺一個人的整體面容、性格,很容易靠眼睛來聯想。然後人腦識別年齡和面容的變化,感覺是靠五官的相對位置來記憶的。
人臉識別科學家希望達到的一個願景,是路上人來人往,而機器能識別出每張人臉,和每張人臉的身份。
-------------
陌陌的人像識別項目中,遇到過的問題 1)二次元人物會被識別成真人;2)網紅明星照片可以剔除 3) 只有半張側臉,或者人臉占背景比例小的情況會有誤判 。
非常有幸和陌陌anti-spam團隊有過一段親密合作,這個團隊的工程師個性很可愛、有情懷演算法能力也強。我參與過幾次大家氛圍超級棒的討論,每次討論現場都是一個很理想很感人的工程師小世界。大家會想出一個演算法,群策群力來校正它,在會議室的3面白板上演算、塗改,一會兒側著頭想,一會兒又喜笑顏開。我會喊大家幫忙用技術化解一些困難,大家會喊我幫他們找應用靈感。
團隊里的演算法工程師們帶我學習了很多東西。JYH帶給我很多地理位置學習、自然語言處理應用在陌陌的妙想。CC博士做了一個他們內部叫二XX的大規模複雜協同過濾演算法,我和他們一起把這個做成了一個超級性感的匹配演算法,一個在合適時點校正後投入使用,會比tinder性感幾倍的演算法。但因為我加入新業務,和一些時點問題,沒能落成。還有W小朋友知道我單身後,有一天給了我一個演算法上幫我脫單的list ,但因為技術保密問題我不能說這是什麼,不過這種自由開心的團隊經歷,想想還真是懷念呀
推薦閱讀:
※計算機視覺技術
※OpenCV實戰:人臉關鍵點檢測(FaceMark)
※中國團隊奪得 MegaFace 百萬人臉識別冠軍,精度 98% 再創紀錄,論文代碼 + 數據全開源
※人臉識別這件「小事」 | 視頻
※乾貨 | 格靈深瞳首席科學家張徳兵:如何進行上億類的人臉識別?