如何看待上海交大研發人工智慧:通過臉部識別技術辨別罪犯?

上海交大研發人工智慧:通過臉部識別技術辨別罪犯


我看過 Xiaolin Wu 和 Xi Zhang 在 arXiv 上發的論文。這篇論文的主要貢獻有:

  • 證明了罪犯和非罪犯的面相的分布不同,在一定程度上可以區分;
  • 指出了罪犯和非罪犯的面相分布中差異較大的一些特徵;
  • 刻畫了罪犯和非罪犯的面相分布特點:罪犯面相的差異度較大,分布在外圍。

這些結論當然要謹慎對待,但如果確實能通過實驗的檢驗,那麼是可信的,也算是填補了一塊知識的空缺。

但是,這篇文章的結論並不代表可以僅由面相推斷一個人是否是罪犯,哪怕僅僅是推斷一個人犯罪可能性的高低。原因有兩點:

  • 在論文使用的數據集(730 名罪犯,1126 名非罪犯)上,哪怕是性能最好的 CNN 分類器,在達到 90% 的檢出率(true positive rate)時,仍有 10% 的誤報率(false positive rate)。這意味著有 73 名罪犯被漏掉,有 113 名非罪犯被冤枉。對於「審判」這種人命關天的事情來說,這樣的分類結果顯然不足以成為唯一依據,甚至都不能成為主要依據。
  • 在一般人群中,罪犯的比例比上面的數據集低得多。此時,哪怕一點點誤報率都是不能忽略的。一個典型的類似例子是人群中的艾滋病篩查。由於誤報率大於人群中艾滋病的發病率,即使檢查得到了陽性的結果,真正是艾滋病患者的概率依然很低,需要複查。如果簡單地把論文中的分類器應用於大眾,那麼絕大多數的陽性結果都將是誤報。

需要警惕的是,媒體在宣傳該項研究的過程中,容易對結論進行誇張,誤導大眾;如果後果嚴重,可能在大眾中產生對特定面相的歧視。這是必須避免的。


有不少答案從技術上討論了識別率和技術的局限性,我看了之後覺得很有啟發。但事實上,即便有一種機器學習技術,能夠不從證據邏輯,而從外在特徵上99.99%的識別出罪犯或者嫌疑犯,這依然是一種不應該被採用的技術,因為其造成的潛在後果是嚴重的,遠遠大於成功鑒別出少數罪犯所帶來的收益。


首先,分辨罪犯和嫌犯,是一種基於事後的分析,也就是說給定這個人可能已經犯下事情了,我們用某種技術來增加自己判定的準確性。以謀殺罪為例子,么每十萬人中謀殺犯罪的概率,中國大概是2.2個人左右。如果機器學習可以準確的掃描出嫌疑人中誰到底是真的兇手,而兇手也知道如此高的鑒別率的話,那麼兇手的犯罪策略就會發生變化——以前可能會留下來冒充無辜,但是現在更多的人會選擇逃跑。那麼破案率雖然會提高,但是因為兇手犯罪策略變化所造成的對沖,所以並無法顯著的降低犯罪的動機——畢竟現在謀殺的概率已經很小了。


其次,為了從這十萬人中揪出這兩三個人兇手,機器學習必然會有一套識別的演算法,那麼久而久之,大眾大概就能根據結果,推測出機器學習給這些「特徵」,比如眼睛、鼻樑、耳朵形狀等所分配的權重是正是負,那麼就自然而然的會形成基於上述特徵的歧視——也就是我們平常說的「統計歧視」。


一旦存在這種統計歧視,那麼也就意味著,具有上述特徵的人和不具有上述特徵的人,付出同樣的努力,被社會所接受的程度是不同的,那麼被歧視的人會從出生開始,面對周圍懷疑和謹慎的目光,要遠遠比其他人更難以融入社會,從而他們很可能會更加的傾向選擇其他的方式,比如犯罪的方式來解決,從而他們的犯罪率,會因為被歧視而顯著提高,從而被更加顯著的歧視……這樣進入了一個惡性的循環,從事後看,機器學習準確無比,幾乎是百分之百的定位了罪犯,但是從事前看,因為這種依據外生變數而非本人行為證據邏輯鏈而判斷的行為,誘導了更多人犯罪,整個社會的治安都會惡化。

事實上,無論具有什麼外在特徵的人群,真正犯罪的人按比例來說都是很少的一部分;那麼為了提高一點事後破案的效率,讓人群中一個顯著比例的人都因為其特徵而受到歧視,從而誘導出更高的犯罪率,這是不可取的。這和倫理和道德都無關——只是社會福利最大化的一個事前和事後的權衡。


用機器去識別人,和用機器去識別圖片是完全不同的,用機器學習去識別圖片是沒有副作用的,因為圖片沒有意識,不能「努力」讓自己變成A種圖片或者B種圖片,所以沒有這種事前和事後的權衡;但是人是有意識的,是可以決定自己的努力的方向的;一旦人類外表的特徵可以用來作為犯罪與否的旁證,那麼必然就會誘導那些本身就具有「高犯罪傾向」物理特徵的人真的去犯罪,因為無論如何社會已經很難容下他們了。


「結果十分驚人,這一系統的識別準確率高達89.5%。」
不知道是記者不懂,還是被忽悠了。90% 的準確率根本不可能用在實際工程中。
我們這邊自己做項目的時候一般至少都拿 95% 作為一個基準,因為在大多數項目中,人的識別率接近90% 到 95%(該數字沒有實驗數據,是我們自己根據我們這麼多客戶統計出來的)。但實際上我們必須要保證準確率達到至少 98% 以上我們自己才敢給客戶用。
這也是為什麼很多賣 api 圖像識別服務沒辦法很好的用在實際工程中,因為不對個案進行相對應的優化只是在自己的實驗數據集中達到一個高準確度是沒有用的。實際場景的數據遠比實驗中的更差,而且前線作業人員的拍攝基本上都不盡如人意。我們見客戶的時候都需要跟他定好高清的是什麼;有的客戶說 4k 是高清,有的客戶說 480p 是高清……新聞中的研究員用的是身份證照片,我敢說這東西如果實用的話百分之百不可能有身份證照片那麼好的實際照片。再回到這個新聞中,研究員在實驗中只能達到將近 90% 的準確率,按照經驗現實中的應該會更低。
即使用九十的準確率作為基準,那也相當於每十張照片,可能會錯一張。機場的安檢用的 x 光機也有帶識別的 ,有些甚至號稱準確率高達 90%——但現實中,大部分這些機器的宿命就是被操作員把識別功能關上或者壓根沒人在乎它的識別,因為誤報率太高。

綜上所述,該新聞主要的意義在於博人眼球。距離實際能用還有很遠的一段路要走(能不能走通不一定)。


一百多年前的隆勃羅梭(Cesare Lombroso)就已經從事類似的研究了。通過分析罪犯的外表來尋找共同特徵。並在當時指出了天生犯罪人的一些特徵。包括先天的隔代遺傳的返祖現象,懷孕期間的高溫。外表可見的如臉部橫向褶皺,較高的兔唇發病率。聽覺、味覺、嗅覺的靈敏度較低等。做過非常多的分析。

而現在的遺傳學出現以後,尤其是HGP以後,對更多的人進行基因測序也再次強化了天生犯罪人的概念。直接結果就是&<戰士基因&>,監獄中的暴力犯罪,或者說除了詐騙犯以外的絕大部分罪犯都擁有這個基因。但這只是數學上的必要條件,卻不是充分條件。這個基因之所以叫做戰士基因,是因為他在優秀的戰士和警察身上也很常見。

所以可以想見,上交的這個試驗,對於直接識別天生犯罪人是有較大的風險的。更大的可能是把擁有戰士基因的人都識別出來了。

從機器學習的角度講,區區1856張照片,還正負樣本各一半。這麼點數據量,訓練人臉識別連貓狗都分不清,用來識別天生犯罪人這麼高層次的東西就是胡扯阿。業界幾家做人臉的公司,即便是稍微簡單的feature,對應的樣本也是幾百萬張量級的。更何況真要願意付出這個成本,幾百萬張的罪犯照片也不難獲得。

再從概率論的角度講,識別正確率89.5%放在深度學習里,都不好意思跟人打招呼。更何況最根本的誤識別率根本沒有給出。這才是很多識別類產品無法推向社會的根本原因。剛剛查到1994年中國人口總量的0.107%是關在監獄裡的,即正常人比罪犯多了近1000倍。那麼一丁點的誤識別率都會在這個產品部署後產生災難性的後果。假設這個系統的誤識別率是識別率的補數,算做10%。那麼假設一個火車站每天經過1萬人,就會識別出1000人是罪犯,真正的10個罪犯里識別出了9個。然後警察就要苦逼在在1000人里利用其他技術識別那不到1%的真正罪犯。同時還有一個真正的罪犯被放行了。

所以,這事主要還是上交的做事方法不夠嚴謹,樣本量太少。進而產生了一個不靠譜的結果,還掩蓋了更嚴重的誤識別率數據。


這妥妥的是21世紀的龍勃羅梭+貝蒂榮的合體版,足以吊打和橫掃一切牛鬼蛇神。
然鵝,我就想問問,你的樣本庫里有這麼多違法犯罪人員是幾個意思。
樣本庫還不到2000人就敢吼了,我局科信處一個科級單位和某技術公司聯合研發的人像比對,樣本庫都是百萬級的,用此工具識別和抓獲的身份洗白的逃犯都幾十個了,至今也只是低調的內部試用。
至於此研究的參照項:
罪犯與常人的的面部特徵有三大不同:一是罪犯上唇的彎曲程度比非罪犯要大23%,二是罪犯兩隻眼睛內角之間的距離比正常人短6%,三是罪犯從鼻尖到嘴角兩條線的角度比非罪犯小20%
這些特徵點太容易改變了,我笑與不笑,微笑還是大笑,還是抿嘴苦笑;我眯眼還是瞪眼;我張口還是閉口……這些角度都會發生改變的。
你難道要求每一個監控下的人都是標準的戶籍照面孔嗎?更遑論清晰度、角度、光線等人力無法改變的外界硬指標了。。。。。。

你可以預測犯罪趨勢指導打防管控(儘管效果有時候很呵呵),但是你要從茫茫人海中預測罪犯和辨別罪犯,我就真的要呵呵了。
沒有證據,談個鎚子啊,統計學上的既往數據何以就證明此人仍將犯罪?歸納邏輯在具體個案上通常都是被打臉居多的。
這個項目早點終止吧,真的,把有限的經費用在有價值的地方不好嗎?當然,立項就是為了騙經費嘛,你請隨意!

最後,真要有心研究人像識別,好好的研究下三庭五眼的核心演算法吧,這是人像識別最基本的也是目前在實際應用中最難突破的。


基於面相師的角度來說,這是完全可行的

因為面相角度來看,只有少數面相是百分之百犯罪的,實際上大部分人都只能說是有潛在犯罪機率

例如眉毛黃薄、眉毛逆生長、眉毛如旋毛,這種大刑六親才特別明顯

不過目前的人臉識別技術明顯的不夠細緻,所以很難作到如面相師的狀態

再來是大部分科普人對於面相這種學問沒啥興趣...也不會特別找真正專業的面相師來研究

所以通過臉部識別技術辨識罪犯的路還是非常非常的長的...


怒答一計!


這麼好的技術,


雖然用於識別罪犯,

存在法律、人權上的障礙,

但是可以推薦給紀委,用於識別貪污受賄、濫用職權、道德敗壞、包養情婦…… 畢竟高科技,讓領導同志先享受起來!


上海交大教授回應爭議:看臉定罪純屬無稽-新聞-科學網

研究初衷是反對「相由心生」

為何要研究這個顯然容易引發爭議的課題?武筱林解釋,自古以來,各個文化中都有類似『相由心生』的說法。就連亞里士多德都認為,由外部特徵可以推斷人的秉性。但他和他的學生覺得這個說法站不住腳。「最開始,我們是抱著懷疑的態度,想用現代科學方法去證偽這種觀點的。」

正因如此,儘管他們早在一年前就做出了這個結果,卻遲遲不願發表出來。


「得出現在這個結論,我們自己也很意外。」武筱林說,他們也曾從各個角度質疑自己的研究。

有人提出,因為罪犯的照片是由警察提供的,而警察使用的照相機有可能在信號上與其他相機不同。針對這個可能性,他們對第一版論文進行了修正:故意在照片的光學信號上加了很多噪音,以淹沒不同相機信號上的差異。在他們新近上傳的第二版論文上,發表了這個新的測算結果:儘管誤判率升高不少,但並沒有推翻之前的結論,分類器仍有75%的準確率。

此外,他們特地重新核實了犯罪者照片的拍攝情況,證實都是普通證件照片,而非被捕後拍攝的。


「如果非要問我為什麼研究這個問題,我只能說,我就是好奇,就是想要追問。」武筱林說。

在他引用的參考文獻中,有一條中文文獻,是宋朝人陳摶所著的《神相全編》——一本流傳甚廣的相術技法大全。書中對人物眼間距、嘴唇和人中部位的描述,恰好與論文中提到的三個差異參量有正相關。


對此,武筱林解釋道,這些是通過純機器學習方法自動識別的、在犯罪組和未犯罪組之間存在顯著差異的位置,與書中描述只是不謀而合。但他也強調,他們同時檢測了《神相全編》中提到的眉毛角度,以及類似研究中常用的瞳孔間距等參量,但都沒有顯著差異。

看臉定罪純屬無中生有

武筱林覺得,人們的擔憂也並非毫無道理。特別是國內一些報道,已經公然用「看臉定罪」作為標題和噱頭。對此他聲明,「看臉定罪」純屬無中生有,堅決反對將該研究成果運用於甄別罪犯或「潛在犯罪者」。他說:「就價值觀來講,我強烈反對任何形式的歧視,當然包括以貌取人」。


加拿大麥克馬斯特大學的電子與計算機工程系主任,蒂姆?戴維森教授則指出,這項研究應當促使人們反思一個問題:長相偏離均值的人是否更容易遭受所謂「主流」人士的歧視和排斥,而其中一些人會因此走上違法道路?


武筱林表示,他現在更希望有人從純學術的角度與他展開探討:「我很歡迎大家用更豐富的數據樣本、更縝密的實驗設計、更嚴謹的數據處理,來推翻這個結論。」


《中國科學報》記者專門就這篇論文諮詢了國內一位計算機視覺和機器學習領域的學者。這位專家表示,這項研究的理想條件是保證所有被試者在同樣條件下、用相同相機拍攝照片,並且確保自然中性情緒。由於題目涉及犯罪分子,這其實是很難做到的。


他認為,即便犯罪分子的照片是被捕前的證件照,也不能排除此時他已經犯罪,或者處在不穩定的生活及情緒狀態下。此外,他不太確定是否能通過添加雜訊來掩蓋相機參數和拍攝條件的影響。


他的觀點是:「在罪犯照片屬性未知的情況下,我傾向於認為這個實驗還不足以給出結論。」


近日有谷歌工程師也發文章反駁這項研究了:

https://medium.com/@blaisea/physiognomys-new-clothes-f2d4b59fdd6a

譯文:通過機器學習來推斷一個人是否是「犯罪分子」?

從科學研究的角度,這項工作的樣本數目前還不足以得到可信的結論。科學研究是一把雙刃劍,早年在克隆人的議題上就有過倫理爭論,現在隨著計算機領域的發展,也開始面臨類似的問題。作為科學研究的主體,科研人員也需要思考科學研究的主要目的是什麼。

面相很大程度上是先天決定的,如果真如機器學習的結果所說,通過一個人的面相就能判斷一個人是罪犯的概率,很容易帶來社會的歧視。這種歧視可能會帶來更嚴重的社會問題,甚至還會出現預言的自我實現過程。長相偏離平均水平被判定為高概率罪犯,導致生活中被歧視,被歧視導致工作,學習等方面受到負面影響,繼而導致在社會中相對處於底層水平,生活難以為繼的情況下,這些人就相對容易產生犯罪傾向。

退一步講,這項研究就算髮現了長相和犯罪可能性之間的相關性,也不是直接的因果聯繫,更不能夠根據個人長相來判斷其犯罪可能性。想要確定因果關係,需要控制單一變數,而長相是先天的,並不能作為變數存在,因此這個因果聯繫是無法證實的。這項研究如果得到的結果是長相與犯罪可能性之間沒有相關性,是可以證明兩者之間沒有因果關係的,反過來就得不到結論。

無論從科學研究的方式,還是這項研究的意義都不值得繼續再投入精力了。


我覺得這個事兒意義不在於是否能識別罪犯,而是證明了面相和行動具有相關性。
其實有一種方式可以理解,面相和情緒相關,情緒容易激動的人面部都有相似的特徵,而情緒容易激動的人也可能容易犯錯,比如打人傷人之類的。
這個論文沒看過,不知道他們有沒有把罪犯分類,是傷害罪、盜搶罪、貪污受賄還是高智商犯罪。我覺得只有一兩種罪是可能通過面相看出來的,比如我上面提到的傷害罪,可能由情緒變化引起。其他的犯罪基本不大可能通過面相表現。

補充:行動受情緒影響非常大。而每個人都有自己的情緒波動範圍,這個是內在的,而且很有可能通過面部特徵表現出來。經常激動的人臉部就容易形成某些特徵,這跟經常鍛煉的人身體容易形成某些特徵一樣。他這個研究就像根據人體的體型肌肉判斷哪些人是否是健身俱樂部的會員一樣,是有一定道理的。然而並沒什麼卵用。

補充2:很多人認為基因決定面相,其實並不全如此,不考慮畸形臉(畸形臉也不在論文的識別範圍),基因只能決定大體框架,人臉的面部脂肪、肌肉甚至骨骼在成長過程中都是可以微調的,而且調動範圍不像想像中那麼小。去研究了一下報道,裡面提到的「罪犯與常人的的面部特徵的三大不同」,確實挺有趣,「一是罪犯上唇的彎曲程度比非罪犯要大23%,二是罪犯兩隻眼睛內角之間的距離比正常人短6%,三是罪犯從鼻尖到嘴角兩條線的角度比非罪犯小20%」,裡面第一、第三點都是提到的嘴——嘴唇和嘴角,而嘴算是人類面部表情最豐富、脂肪最多的地方之一,完全可以說和基因無關,單靠後天長期做某些表情就可以改變嘴的脂肪、肌肉分布。而第二點眼睛距離雖然看起來鍛煉不出來,不過差距只有6%,非常小,也是可以通過長期的微表情改變的,況且這麼小的差距也不能用來識別什麼,作者的論文應該主要還是靠第一、第三點。


首先,這個新聞標題誇大了研究結果,有誤導圍觀吃瓜群眾的傾向。我也把論文大致看了一遍,這個回答大概分為一下幾個部分:
1、總結一下這個論文的研究成果。
2、簡單結合論文里的圖文逐條分析一下每個研究成果,並對新聞進行一些分析(其中會涉及到一些識別方法,不感興趣的知友或者專業人士可直接跳過看第三部分)
3、這篇論文的實際意義和自己對模式識別和犯罪行為的一些引申思考(可能的應用,倫理等問題)。
------------------------------------------------------------------------------------------------------------------------
一、研究成果(註:下文提到的「普通人」均指「非犯罪分子」)
1、研究發現:犯罪分子的和普通人在某些臉部特徵上存在一定差異。
2、犯罪分子相貌變化範圍比普通人的相貌變化範圍大,換句話說,犯罪分子的長相的方差比較大,長得歪瓜裂棗的要多一些。
3、犯罪分子和普通人的「均臉」幾乎是一樣的,沒有明顯差異。平均的相貌構造都差不多,用句不太精確的話講,犯罪分子的平均顏值跟普通人的平均顏值差不多。
------------------------------------------------------------------------------------------------------------------------
二、論文及新聞分析
在看論文之前,我們先看新聞稿,其中有一句話非常具有誤導性:「在實驗過程中,研究員使用了1856名男性的身份證照片,他們的年齡在18到55歲之間,其中一半的人有犯罪史。90%的照片用來訓練這一AI演算法,剩下的10%用來檢驗演算法效果,結果十分驚人,這一系統的識別準確率高達89.5%。
非行業內人士看到「89.5%」這個數字內心可能會覺得「握草,略屌」,似乎只需要把可疑罪犯的身份證放進AI演算法里計算一下,就能八九不離十地判斷出這個人到底是不是罪犯。但是我們仔細分析一下,就會發現這個結果是存疑的。首先:這裡89.5%的識別準確率僅僅是針對18—55歲之間的男性。其次:雖然這篇文章採用的訓練樣本盡量排除了一些干擾因素,試圖讓整個樣本更具有普遍性和代表性,但是這依舊是人工的篩選,所以樣本中很可能存在一些特殊樣本的集合,除非從理論上把一些干擾因素對樣本特殊性的影響進行論證排除。第三點:犯罪分子和普通人的訓練樣本的數量不夠大。因此,在實際的應用中(僅用於識別18—55歲之間的男性),這套系統的識別準確率很可能會低於或者遠低於89.5%。
接下來我們就具體分析一下這篇論文講了啥。
我們先看一下論文的Abstract的一段話:「Above all, the most important discovery of this research is that criminal and non-criminal face images populate two quite distinctive manifolds. The variation among criminal faces is significantly greater than that of the non-criminal faces. The two manifolds consisting
of criminal and non-criminal faces appear to be concentric,with the non-criminal manifold lying in the kernel with a smaller span, exhibiting a law of 」normality」 for faces of non-criminals."
大概就是:這篇論文最大的發現就是犯罪分子的相貌變化範圍比非犯罪分子的更大,更分散,也就是前面提到的方差更大。但是呢,兩者的「均臉」是一樣的,重合的,也就是文中提到的"concentric"。
在論文中也對這個結論進行了詳細的論證說明,這裡我從論文里截取了幾個代表性的圖片來說明這個結論。

這張圖裡的加號「+」代表犯罪分子的臉的分布, 圓圈「o」代表非f犯罪分子的臉的分布
原文有一句話:「The data clouds of criminals and non-criminals can be visualized in Figure 12(也就是我們這張圖), in which the first four most significant dimensions of the Isomap are represented by the x, y, z axis, and the color temperature.」 這句話的意思呢就是,我們看到的這張圖的每個點其實是四維的,即空間的三維坐標加上顏色。這四個維度能從很大程度上表示一張人臉,具體的降維分析演算法這裡不再展開。總之呢,讀者只需要清楚一點,這裡的每個點就代表一張人臉。從這張圖,我們可以明顯看出犯罪分子的臉的分布要比非犯罪分子的臉的分布更加的分散。

這張圖表示的是在兩種表示方法下犯罪分子的均臉和非犯罪分子的均臉。左邊兩幅是犯罪分子的均臉(a和c圖),右邊兩幅是非犯罪分子的均臉(b和d圖)。結論是什麼呢。文章中這樣說:「Although the antithesis of criminals and non-criminals is very strong, conventionally-defined average faces of the two populations Sc and Sn appear hardly distinguishable as demonstrated in Figure 10.」這段話的意思是,雖然犯罪分子和非犯罪分子是完全對立的兩面,但是兩者的均臉相差卻很小,很難區分。換句話講,犯罪分子和非犯罪分子社會屬性(論文中曾提到的「social attribute」)的巨大差異性在均臉上並沒有被很好的體現出來。看到這張圖片,可能很多人跟我有一樣的發現:似乎犯罪分子的均臉比非犯罪分子的均臉看起來更凶一點。非犯罪分子的均臉面帶微笑,顯得更加溫和。這是不是也印證著某些普遍的社會認知?比如,活潑開朗的人更不容易犯罪,更不容易走向極端。所以說,保持一個好的心情和性格是一件挺重要的事呢,很可能會降低整個社會的犯罪率水平。/認真臉

這張圖呢說的就是犯罪分子與非犯罪分子在某些特徵上存在的一些差異,即在 ρ、d、θ這幾個參數上的差異。最終的發現就像新聞稿里說的:「一是罪犯上唇的彎曲程度比非罪犯要大23%,二是罪犯兩隻眼睛內角之間的距離比正常人短6%,三是罪犯從鼻尖到嘴角兩條線的角度比非罪犯小20%。」
以上就是結合論文和新聞的一些簡單的分析。接下來的第三部分,才是我想說的一些重點。
------------------------------------------------------------------------------------------------------------------------
三、與技術相關的思考和討論
把論文的研究結果分析結束之後,我們接下來就要探討這篇論文研究成果的一些現實意義。我們先看一下這篇論文的出發點,文中有一段話:「Is there any diagnostic merit of the
face-induced inferences on an individual』s social attributes? In this paper we
intend not to nor are we qualified to discuss or debate on societal
stereotypes, rather we want to satisfy our curiosity in the accuracy of fully
automated inference on criminality.
」大概翻譯一下就是:本文是為了研究人臉的特徵對一個人的社會屬性的推理是否有一定的判斷價值或參考意義,這篇文章並不是討論或者爭辯社會偏見的問題,而是為了滿足我們對基於人臉識別對犯罪行為的自動推理的精確性的好奇心。進一步說這種好奇具體是指:好奇人的臉部特徵和犯罪行為之間的相關性大大不大,好奇罪犯的臉和非罪犯的臉之間的差異大不大。換句話說,我們只是出於好奇研究一下範圍分子和非犯罪分子臉部特徵的差別,至於牽扯到的一些社會問題和爭論不在本論文探討範圍之內。
科學技術一直是一把雙刃劍,關鍵看人們怎麼去用。那麼,我們就先來討論一下其中可能會引出的一些社會問題。最可能的問題就是社會偏見,其他答主也有提到一個關鍵詞「誤報率」——本來你不是罪犯,結果機器有一定的概率把你辨別為罪犯。假設在多年以後,這種罪犯的辨別技術被推廣到公司應聘,你作為應聘的一員,被公司的AI機器認定為是罪犯,但是由於不能百分之百確認你是罪犯,因此公司很有可能本著「寧殺一百,不放過一個」的心態而把你拒之門外。我們再假設一種情景,會不會出現這樣的情景:國家為了消除社會治安隱患,會在採集公民頭像信息的時候就利用這樣的技術進行「犯罪識別」,然後根據識別結果列出治安黑名單,然後對黑名單上的人員進行重點監督甚至是對一些匹配度很高的人進行提前的監禁或暗殺。就算國家只是對黑名單上的人進行監督,但是一旦這個黑名單泄露,就會對公民本人造成很大的影響。三人成虎,社會的偏見和輿論都會殺死一個人的。
因此,這個研究結果的應用就目前來講,正如@魚子醬要努力的回答中所說的:「罪犯identification可以,罪犯prediction就很。。容易over generation.」 意思就是我們可以利用這門技術在某些已經發生的案件中,對一名或者多名嫌疑人進行初步的甄別,然後結合實際的證據等等對被甄別出的一些人進行重點分析排查,降低篩選排查成本。但是,我們不能毫無根據的僅僅因為某個人的長相來判定他有犯罪趨勢,判定他很可能成為壞人,從而對其進行區別甚至歧視對待。也就是所說的「罪犯prediction」。
在日本的一部動漫里就曾經展現過類似於我們剛剛討論的一些情景,這部動漫叫做《PHYCHO-PASS》,中文譯作《心理測量者》。

這部動漫大概講了未來的這樣一個場景:
「在不遠的未來的一種社會形態,在這個社會,有一個叫做西比拉(SYBIL)系統的管理所有社會成員,每個人都會有個PHYCHO值,這個值代表你的心理狀態,有點類似於當今社會所說的正能量,你越有正能量,你的心理狀態越好,數值反映的顏色會越清澈,社會對你的評價就更高,大家都會覺得你是個好人,但你假如對社會充滿怨念,想要報復社會,一旦在城市無處不在的西比拉檢測系統發現你的顏色變得渾濁,你就被當做潛在犯關押和治療,而一般很少有人能在這種治療中變得積極樂觀,情況只會越來越糟,最後被社會淘汰。」這段話來自一名網友【動漫】犯罪的至高藝術——PHYCHO-PASS(心理測量者)
「在這樣的未來,人類的心理狀態和性格傾向都能被數值化。所有的感情、慾望、社會病態心理傾向等全部被記錄並管理,大眾以「好的人生」作為目標,竭力於數值性地實現它。所有的監控攝像頭都已經被升級和聯網到一體,通過監視人類的色相渾濁程度和聲音、視頻等信息用來計算人類的每個心理狀態和個性傾向所衡量的值,即PHYCHO值,它被用作判定人們的思想應有PSYCHO-PASS狀態、個人精神本身。通過計算這些數值,系統可以自主斷定一個人最理想的工作,感情,心理壓力,甚至犯罪意圖。
因此,為讓大眾達到「理想的人生」這個指標,人們實現這些數值就變得非常積極。然而,有關犯罪的數值,也就是「犯罪指數」也會被測量,當然犯罪者亦是如此。因此,人們需要不斷地保證自己的指數在正常範圍,否則會被系統認為是潛在犯,將會被"矯正"。」這段話參考心理測量者_百度百科
動漫里的PHYCHO值對應著論文里研究的一些臉部特徵的差異值,我們也可以大概的把這些特徵差異不嚴謹地認為是顏值差異。假如將來我們通過人臉識別的技術,把罪犯的識別率提到了一個相當高的水平(99%以上),那麼動漫里所描述的那些場景出現的可能性就很值得我們去思考。霍金對AI的擔憂不是沒有理由的,其中涉及到的AI技術的發展所帶來的一些倫理和法律問題,這些問題有很多都在人們的視線之外,甚至是視覺死角。這些問題是霍金所擔心的,也是我們需要警惕的部分。
------------------------------------------------------------------------------------------------------------------------
說完一些,非技術層面上的思考,接下來說一下技術層面上的思考。
有一部美劇,叫做《疑犯追蹤》。看過這部劇的人第一感覺是劇中的主角是圖中的這兩位:

而實際上還有一個至關重要的「主角」:the Machine。這裡的Mechine不是一個人,而是一台機器或者說一個程序。首先介紹一下大概的故事情景架構:「軟體天才芬奇(Finch)發明了一個程序,通過觀測已有的模式來識別有可能進行暴力犯罪的罪犯,他僱用了一位被推定死亡的前美國空軍特種部隊隊員和前CIA里瑟(Reese),二人使用國家級的監測技術,加以Reese的專業技能和Finch的無限財富,開始「法外執法」,力圖在犯罪發生前就對其加以阻止。」疑犯追蹤_百度百科
大概就是:一個土豪程序員發明一個能提前甄別出有可能進行暴力犯罪的罪犯的程序,然後僱傭前特種部隊對員Reese對這些可能罪犯進行跟蹤,力圖在犯罪行為發證之前進行阻止。 這裡的程序(即進行犯罪識別的一套演算法)在劇中被稱為:Mechine。
根據劇中的一些提示,這套演算法的原理大概就是:利用全國攝像頭以及一些監聽設備採集的視頻和音頻信息進行處理和分析,最終提前找出與即將發生的犯罪行為相關的人。涉及到的技術有,圖像識別,語音識別,語義分析,雲計算,數據挖掘,多信息融合等等。也可以簡單的概括為:data-driven,即數據驅動。而其中能真正很快提高識別準確率的就是「多信息融合技術」,除了利用臉部特徵信息,還可以利用聲音特徵信息,利用聲音內容(比如電話交談)等信息進行融合和判斷。用老祖宗的一句古話講就是:「偏聽則暗,兼聽則明。」
end.
如有錯誤之處還望各路大神多多指正。
參考文獻:
【1】 X.L Wu, Z.Xi. Automated Inference on Criminality using Face Images.


事先預防犯罪……服!
犯罪實施中止,叫未遂。這技術提前再提前,估計能發展到出生即貼"此娃是大概率罪人"標籤,神來之筆啊。

即使用於重口群再(面貌)甄別,也極為不妥。

如果是非應用課題,無可厚非,否則,腳踏實地,群眾路線,只在黨內倡導,遠遠不夠啊。


這個也不算是特別新的吧。

最主要估計是對一些低智商特徵的識別,低智商導致犯罪的概率高。


心理測量者?老虛,你贏了。→_→


我感覺這個研究本身就是個偽命題,我從法學方面提個問題,這位研究者怎麼定義「罪犯」?
自然犯這一類還勉強說的過去(明顯違反倫理道德的傳統型犯罪,如強姦、殺人),但是法定犯的外延從來都不是絕對的,假如計劃經濟時期的「投機倒把罪」現在還存在,那這套系統會把馬雲他們也識別為罪犯嗎?假如明天刑法規定走路先邁右腿的行為屬於犯罪,這個系統又怎麼對人進行判定?


做出了100%識別的儀器,帶著儀器進了人民大會堂,儀器瘋狂鳴笛
最後不得不砸了儀器,計劃擱淺


首先請考慮以下情景:
一個常年在第一線接觸各種人員的警察對於判斷一個人是否「有問題」很有經驗,十猜九中,那麼,僅僅因為他的判斷的準確度很高,就能夠將主觀判斷作為呈堂證供嗎?最終,這個經驗豐富的警察必須依賴刑偵手段獲得客觀的證據,從而驗證自己最初的主觀判斷。「客觀證據為主,主觀判斷為輔」,這才是合理的情況。

可惜的是,同樣的事情,到了機器學習演算法上就可能迷惑大眾。因為相當一部分人只要看到表面的「有效性」,就忽略了本質的「主觀性」。

---邏輯的分割線---
將深度學習默認為一種「無偏見的判斷」是對深度學習本質的嚴重誤解。基於神經網路的演算法,例如深度學習,恰恰依賴於「偏見」,或者說由訓練得到的一種「認知模式」。

既然深度學習模仿人類的大腦,那麼很顯然,人類大腦可能做出的錯誤估計,深度學習模型也有可能產生。稍微了解深度學習原理的人就應該知道,深度學習模型做出的判斷是「無意識」的:演算法在樣本標籤和樣本值之間形成一種隱含的、近似本能的聯繫,並在之後的判斷中利用這種聯繫。

舉個例子來說,人類普遍擁有通過面部表情來判斷個人情感的能力。怒髮衝冠和喜笑顏開給人的感覺當然不一樣。而目前的深度學習很容易實現對簡單表情的判斷。但是,人類對面部表情的判斷是」無偏見「的嗎?恰恰相反,由生存本能、經驗和記憶中形成的對面部表情的快速判斷和應對能力依賴的就是「偏見」:「過去的經驗告訴我,當我面前這個人露出扭曲的表情時,我可能要小心了」。這種與經驗的聯繫,就是一種「偏見」,因為實際上除了「我」的主觀經驗和感覺,「我」並沒有純粹客觀的手段去判斷到底自身會不會受到威脅。同時,這種判斷常常是無意識的,例如,一個人目露凶光可能導致旁邊的人本能性地警覺起來。

那麼,可能有人會說,這樣的「偏見」可以有效提高應對危機的能力,有什麼不好呢?這裡,我認為就是上述論文最tricky也最危險的地方:很多人根本沒有正確認識主觀適用範圍-包括深度學習這個簡化版「大腦」的主觀-的能力。

對個人來說,通過表情判斷感情狀態可以說是必備技能,不會察言觀色的人常常不能有效迴避人際關係衝突。假如我們將深度學習運用到人際交往領域,想必能夠有效改善交流的有效性,科幻作品中常常出現感情輔助分析就是一種可能的應用。然而,上述論文並不是如此單純的話題,而是進一步將深度學慣用於判斷人的「本質」。這實際上與人類大腦主觀判臆斷對方性格是一個套路。只是,個人即使常常主觀臆斷,其影響也很少超出「人際交往」這個層面,我們在大部分情況下沒有權利也沒有能力去判斷一個人最本質的東西,或者說靈魂(廣義的)。那麼,同樣是模仿人類大腦的深度學習模型怎麼可能擺脫偏見,做到純粹「客觀」?演算法在客觀意義上的準確度再高,主觀判斷就是主觀判斷,不會因為「它過去的判斷很準確」就變成客觀事實。因此將面部識別用於超出一般人際交往的情景是極端危險且自大的嘗試。(甚至可以這樣問,即使將類似嘗試限定在「一般人際交往」的層面上,我們就可以肆無忌憚地使用了嗎?)

所以,綜上所述,我們有可能通過深度學習再現更加準確的「主觀判斷」,但也僅僅是higher accuracy compared with human beings ,「主觀」這一特徵都是一樣的。假如忘記這個主觀性,就等同於把主觀客觀化。而更加不巧的是,深度學習所具有的高度複雜的數學的外在,令一般人進一步強化了對於其虛假的「客觀性」的信任。假如這種錯誤的信任上升到全社會水平,後果將會是災難性的,此處完全可以參考動畫psycho-pass。

同理我也不能理解,到底上述論文的作者為何能夠認為深度學習可以做到「無偏見」或者說是100%」客觀「。唯一可以稱得上是「客觀」的,只有邏輯,或者機制,假如拋開這兩者,機器學習將不會是有效的工具,而會毫無疑問地變成猛毒,使人類的求知慾變得怠惰。

當然,最後應該指出,上述論文作者並不希望將結果做過分延伸,原文已有聲明。不過,科研工作者不應該忽視科研成果的長期的、潛在的影響。當達爾文發表進化論時,應該也沒有預料到他的理論會誕生出「社會達爾文主義」這種怪胎吧?或者,孟德爾創立遺傳學時,也決計想不到未來會出現「基因滅絕」的概念。


我換一種表達方式吧。人工智慧在生活中的運用就像我們的大腦。

我們在生活中,腦子可能會閃過無數直白的、直接的、不經思考的想法,這些想法有些可以拿來與人溝通交流,而大多數則是不能直接說出來的。

例如,你今天要約一個客戶喝咖啡。到了約定的時間,你見到了你的客戶。幾米開外,你就通過你的眼睛感知,圖像傳送到大腦,大腦經過識別,得出了一個結論,你的客戶的牛仔褲拉鏈沒有拉上。你當然不能直接告訴他,那他會多尷尬。可你又不能不告訴他,基於你是一個善良的人,你不忍心看見他接下來將面對的無數尷尬而且不自知。這時候你該怎麼表達出他的牛仔褲拉鏈沒有拉上而又不讓他覺得尷尬呢。答案有很多,這當然取決於你的智慧。你當然不會覺得,哎呀,我就不該發現他牛仔褲拉鏈沒有拉的。當然,也不排除有人的癖好就是讓別人難堪。

再說到這一項技術,我發現你犯罪幾率大就好比我發現了你牛仔褲拉鏈沒拉上。然後我善良啊,該如何讓你不尷尬呢,就好比我該怎樣使用這項技術。


你不能說我能發現你牛仔褲拉鏈有沒有拉上這件事是錯誤的吧。

那這項技術怎麼用好呢?當然取決於使用這項技術的人,公司、政府。不管怎麼用,我也不相信會有人傻到把這些數據公開到每一個人身上。

也許你害怕別人知道你犯罪幾率大,或者你不想看見這種新型的「看臉」歧視。其實,這些數據不可能被普通人看見的。

反觀現在大數據在人工智慧中的運用。剛開始,你會覺得侵犯了你的隱私。你的照片、你的網路瀏覽記錄、你的聊天內容等等等等就這樣被各種公司搜集,你覺得恐慌。而現在,你明白,這些數據不過是被人工智慧搜集,被人工智慧處理,通過人工智慧反饋給你有用的信息。工作人員也不會閒情逸緻到在大到無邊的數據中去看查你的聊天記錄。他們沒這個心情,沒這個精力,可能也根本查不到。

或者有極少數人能看見,你還是覺得不安心。那我舉一個粗俗的例子。你要去看婦科醫生,是個大老爺們,你非常難為情。可你不知道人家醫生一天看了多少。你還不知道人家醫生心裡可能想的是趕緊脫,別磨蹭,看完這個我就下班了。


嗯嗯,有的同學從技術上回答了,我就從實際效果上回答吧。

要說面部識別,那肯定無論什麼機器都比不上人眼的識別(目前),但是人的精力是有限的。假如給你一張某人的正面肖像圖,然後給你一百萬個照片,讓你從這一百萬張照片中找出來這個人,你得干幾天幾夜?但是如果有了這個機器的輔助,那麼就可以從一百萬張照片中縮小尋找的範圍,有可能就剩十萬張照片了,這樣你尋找的時間就大大縮短。

所以我覺得人工智慧識別技術就跟測謊技術似的,雖然目前肯定是無法成為定案的依據,但是可以大幅提高辦案的效率和準度。

接下來是兩學一做時間。
科學技術是第一生產力。在這個意義上,科技對法律有根本的決定作用。具體表現在以下幾點:
(1)科技對法的制定及實施都產生了新的挑戰,改變了法律調整的範圍;
(2)科技改變了法律規範正當化的前提,凸顯出成文法的局限性;
(3)科技的發展使得社會處於急劇變動之中,從而使得某些法律概念、法律原理出現滯後性;
(4)科技改變了人們守法或者違法的成本。


聽說,注意是聽說啊,真實性待查證。

去年高考考生名額波動時,江蘇家長多次有組織性集體請願,靜坐等行為讓有關當局不安。相關部門用

監控攝像頭面部識別
+
公安部居民數據

精確定位到每個家長家裡,主動上門

「聊天」,

簽「保證不再犯事」協議,拒絕簽字者子女高考「受到影響」……在微博看到的,真實性未知,求查證

若是真的,那是不是已經投入應用了?


推薦閱讀:

如何評價微軟高級工程師對FaceID「我不知道蘋果打算如何繞開我這個專利」的發言?
對異性來說,看起來成熟的臉會更有吸引力嗎?這個會有性別差異嗎?
頭部向肩膀左右傾斜 15 度以上就能躲過人臉識別系統是真的嗎?
「臉盲」與「閱讀能力」真的相關嗎?
人臉識別的技術能判斷區分兩個雙胞胎或者長相非常相似的人嗎?

TAG:人工智慧 | 人臉識別 | 犯罪 | 神經網路 | 面相 |