人工智慧之人臉識別(1)人臉識別標註
來自專欄程序員的寫作4 人贊了文章
一、背景簡介
眾所周知,人工智慧是未來的趨勢,其中人臉識別是運用得比較廣泛的一項技術,如支付寶、微信的安全驗證、表情識別、人臉動畫合成、直播、美顏、特效相機等互聯網產品。最近對機器學習中的人臉識別學有小得,想著試試進行數據集訓練,建立機器模型進行人臉識別。
二、人臉標註由來
人工智慧公司如曠視科技、商湯是數據標註的需求大戶,因為他們需要大量的數據進行訓練、建立模型,從而優化他們的演算法。同理我們這種小蝦米手裡沒有標註過的數據集,只能去看看有沒有現成的,萬一沒有就只能自己來進行數據標註了。
三、人臉數據標註
目前人臉識別我認為做得最好的是曠視科技,於是我去他們官網看了一下,了解到臉關鍵點是對於圖像中人臉五官與輪廓定位的標註,主要用來對人臉的關鍵位置,如臉廓、眉毛、眼睛、嘴唇進行定位,人臉關鍵點檢測是人臉識別過程中重要的一步,同時的爆火也得益於人臉關鍵點相關技術水平的提升。據我觀察它們的數據標註一般是如下圖所示:
從上圖可以看出
左眼10點、右眼10點、左眉8點、右眉毛8點、鼻子8點、嘴巴18點、輪廓20點,總共92點人臉標準,但是曠視科技標的是106點標註,我猜測有可能是耳朵左右各7點,或者耳朵左右各3點,額頭有8點,這個暫且不表。
在了解過程中,發現有的數據標註公司為人工智慧公司使用的都是95點人臉標註,如數據堂智能科技有限公司,他們的95點標註分別為
左眼10點、右眼10點、左眉8點、右眉毛8點、鼻子6點、嘴巴22點、耳朵6點、輪廓21點
據我觀察可以具體分為以下:
一左眼
1. 左眼瞳孔
2. 左眼左眼角
3. 左眼右眼角
4. 左眼上部最高處
5. 左眼下部最低處
6. 左眼左眼角與左眼上部最高處的等分點
7. 左眼左眼角與左眼下部最低處的等分點
8. 左眼右眼角與左眼上部最高處的等分點
9. 左眼右眼角與左眼上部最低處的等分點
二右眼
10. 右眼瞳孔
11. 右眼左眼角
12. 右眼右眼角
13. 右眼上部最高處
14. 右眼下部最低處
15. 右眼左眼角與右眼上部最高處的等分點
16. 右眼左眼角與右眼下部最低處的等分點
17. 右眼右眼角與右眼上部最高處的等分點
18. 右眼右眼角與右眼上部最低處的等分點
三左眉
19. 左眉左眉角
20. 左眉右眉角
21. 左眉上2分之1處
22. 左眉下2分之1處
23. 左眉上4分之1處
24. 左眉下4分之1處
25. 左眉上4分之3處
26. 左眉下4分之3處
四右眉
27. 右眉左眉角
28. 右眉右眉角
29. 右眉上2分之1處
30. 右眉下2分之1處
31. 右眉上4分之1處
32. 右眉下4分之1處
33. 右眉上4分之3處
34. 右眉下4分之3處
五鼻子
35. 鼻尖
36. 鼻子最下處
37. 鼻樑左側(與兩眼睛內點連線,與鼻子左邊的交接點)
38. 鼻樑右側(與兩眼睛內點連線,與鼻子右邊的交接點)
39. 左上鼻翼
40. 右上鼻翼
41. 鼻子左邊最寬的部分
42. 鼻子右邊最寬的部分
43. 鼻子最下處與鼻子左邊最寬的部分的等分點(36與41的等分點)
44. 鼻子最下處與鼻子右邊最寬的部分的等分點(36與42的等分點)
45. 左鼻孔中心
46. 右鼻孔中心
六嘴唇
47. 左嘴角
48. 右嘴角
49. 上嘴唇上2分之1處
50. 上嘴唇下2分之1處
51. 上嘴唇和鼻唇溝的左交點
52. 上嘴唇和鼻唇溝的右交點
53. 左嘴角與51點的等分點
54. 右嘴唇與52點的等分點
55. 上嘴唇上4分之1處(即左嘴角和49的等分點)
56. 上嘴唇上4分之3處(即右嘴角和49的等分點)
57. 左嘴角與50的等分點(即上嘴唇下4分之1處)
58. 右嘴角與50的等分點(即上嘴唇下4分之3處)
59. 下嘴唇上2分之一處
60. 下嘴唇下2分之一處
61. 左嘴角與59的等分點(即下嘴唇上4分之1處)
62. 右嘴角與59的等分點(即下嘴唇上4分之3處)
63. 下嘴唇左半邊3分之1處(即左嘴角和60的3等分點)
64. 下嘴唇左半邊3分之2處(即左嘴角和60的3等分點)
65. 下嘴唇右半邊3分之1處(從左往右的順序,即60和右嘴角的3等分點)
66. 下嘴唇右半邊3分之2處(從左往右的順序,即60和右嘴角的3等分點)
67. 下嘴唇下4分之1處
68. 下嘴唇下4分之3處
七耳朵
69. 左耳耳朵最高處
70. 左耳內外耳骨最近的位置
71. 左耳耳垂下面
72. 右耳耳朵最高處
73. 右耳內外耳骨最近的位置
74. 右耳耳垂下面
八輪廓
75. 左側臉頰,與左眉毛的兩個眉角連線的交點(19與20連線)
76. 右側臉頰,與右眉毛的兩個眉角連線的交點(27與28連線)
77. 兩外眼角連線,與左邊輪廓的交點
78. 兩外眼角連線,與右邊輪廓的交點
79. 下巴中心
80. 左臉輪廓77到79的8個等分點1
81. 左臉輪廓77到79的8個等分點2
82. 左臉輪廓77到79的8個等分點3
83. 左臉輪廓77到79的8個等分點4
84. 左臉輪廓77到79的8個等分點5
85. 左臉輪廓77到79的8個等分點6
86. 左臉輪廓77到79的8個等分點7
87. 左臉輪廓77到79的8個等分點8
88. 右臉輪廓78到79的8個等分點1
89. 右臉輪廓78到79的8個等分點2
90. 右臉輪廓78到79的8個等分點3
91. 右臉輪廓78到79的8個等分點4
92. 右臉輪廓78到79的8個等分點5
93. 右臉輪廓78到79的8個等分點6
94. 右臉輪廓78到79的8個等分點7
95. 右臉輪廓78到79的8個等分點8
四、人臉標註實操
在了解人臉標註的標準是什麼樣的之後,我們進入數據標註實操。通過,了解可知,labelme是一個非常好用的數據標註工具,打開Anoconda Prompt 運行界面,輸入lableme
出現以下的界面
五、數據標註發展背景
數據標註是人工智慧發展中創造出來的一個行業,目前已經創造除了10萬+的就業崗位,大多是在校學生做兼職,一直有一小部門聾啞人,但是這個就業前景怎麼樣,依我來看還是有發展空間的。因為目前的人工智慧運用得比較多的還是機器學習中的監督學習,意思就是說需要先把數據標註好,告訴機器哪個是蘋果,哪個是梨子,哪個是嘴巴,哪個是鼻子,需要大量的數據進行數據訓練。所以數據標註行業在5年內還是一個持續發展的行業,但是一旦機器學習有了質的提升,開始往半監督學習以及無監督學習,那麼數據標註這個行業就將要面臨轉行了。所以,人工智慧才是未來的發展趨勢,做數據標註如果不往技術層面轉,以後可能會面臨失業。
推薦閱讀:
※知識圖譜的技術與應用(18版)
※AI算硅基生命嗎,為什麼?
※搜狗做AI:圍繞語言,力出一孔
※人工智慧時代的「美麗新世界」
※5-18歲孩子學編程,什麼語言最合適?