特稿 | 斯坦福學者利用AI鑒別"同性戀臉" 引發隱私之憂

實習記者 杜偲偲 記者 苑蘇文

孔子「以貌取人,失之子羽」,意思是憑肉眼觀容貌判斷一個人的才能似乎難免失誤,當計算機技術介入其中,面部特徵與個人特質間的相關性便被試圖建立起來。但當演算法能輕易通過面部特徵推斷隱私時,技術發展帶來的未來新世界便可能失去控制。

比如,美國斯坦福大學的研究者們訓練出了人工智慧分類器,可以通過臉部照片推測照片中人的性取向,判斷準確率最高可達91%。此成果一經發布,便引發爭論。人們擔心,此項技術如果普及,會讓許多不打算公布性取向的人士無所遁形。

「很多的技術的發展確實會帶來相應的倫理、社會、道德問題,這是科學發展的自然規律,科學家在研究的過程中需要更多的關心這方面的問題。」研究者之一王軼倫向財新記者表示,在文章發表前,他們也和許多組織、機構、學者就此做過溝通。

演算法歸納出「同性戀臉」

9月7日,美國斯坦福大學助理教授邁克爾·科辛斯基(Michal Kosinski)和其學生王軼倫在心理學權威期刊《人格與社會心理學雜誌》上發表了論文《深度神經網路基於人臉圖像判斷性取向比人類更準確》,他們利用VGG-Face深度神經網路模型提取從臉型、嘴型、鼻型、眉形到面部的毛髮等面部特徵並將其量化,以此訓練分類器區分出不同性取向。其樣本數據來自於美國交友網站上的公開資料,包括36630名男性的130741張照片和38593名女性的170360張照片。

研究者認為,人臉中包含的有關性取向的信息遠多於人腦所能感知到的。憑單張圖像,分類器能夠以81%的準確率區別同性戀和異性戀男性,以71%的準確率區別女性,而相對應的人類判斷為:男性準確率61%,女性54%,表現要低於演算法。如果把每人5張面部圖像輸入分類器,演算法準確率提升至91%和83%。

研究發現,同性戀長相性別特徵相對更加不典型,男性的面容女性化程度與其同性戀概率呈正相關,女性則與之相反。具體而言,同性戀男性的下巴更窄、鼻子更長、額頭更大,同性戀女性則相反。

不過,這不代表所有的同性戀男性長相都女性化,也不代表所有同性戀女性長相都不女性化。關於研究的局限性,作者提到,其數據樣本限於白人、沒有排除雙性戀,也無法排除長相「更同性戀」的人更容易「出櫃」的情況。

合理性、準確性均遭質疑

自論文發表後,更多人對於該研究能以高準確率靠面容推測性取向十分擔憂,認為該技術一旦推廣將嚴重侵犯個人隱私,甚至會給一部分人帶來人身危險。據國際男女同性戀聯合會統計,目前全世界仍然有71個國家將同性戀視為犯罪。

論文作者王軼倫卻稱,選擇公布這一成果,是「希望通過此研究幫助政策制定者和少數群體去理解演算法可能帶來的對隱私的傷害,進而採取一些預防性的隱私保護措施。」

王軼倫稱,他的研究合作者很早就開始關注能否通過大數據的方法,分析人們的電子足跡去推測個人的性格特徵,進而幫助人們理解互聯網時代的隱私問題。「面部特徵暗示了很重要的隱私信息。」

論文還認為,計算機這一識別結果與被廣為接受的性取向的產前激素理論(PHT)相符合。根據產前激素理論,產前激素影響成人性取向,男性胚胎過少地暴露在雄性激素中,或女性胚胎過多地暴露在雄性激素中,都可能造成性取向的變化。該理論認為產前激素也與兩性面部分化相關,同性戀人群傾向於具備性別上不典型的面部形態,即同性戀男性面部應該更女性化,同性戀女性面部應該更男性化。

但是,究竟是什麼決定了性取向的不同?目前尚未有定論,這一研究受到性學專家的質疑。

性社會學家李銀河向財新記者介紹,學術界對於性向的形成主要有「生理決定論」和「社會建構論」兩派觀點,此研究的價值可能在於作為依據支撐「生理決定論」,而按照「社會建構論」的觀點,同性戀不是一種身份,而是一種「去做」的行為。

李銀河以古希臘時期舉例,她介紹,在當時同性性行為是一種普遍的實踐,每一位少年都有一位成年的師傅教與他文化和格鬥,同時也是他的性伴,而少年長大之後也會結婚生子。從「社會建構論」出發,她認為並沒有同性戀這樣一個固定的人群,人的性向也是不斷流動變化的,對於同性戀是難以識別的。

「以貌取人」漸成現實

一個人的臉上所能解讀出的信息量或許真的「出人意料」。

據《經濟學人》報道,一些公司正通過分析臉部特徵來自動診斷罕見遺傳疾病,比如顱骨發育不良伴肢端溶骨症(Hajdu-Cheney綜合症)。測量情緒的系統也許能讓自閉症患者更好地理解對他們來說難以捉摸的社交信號,同樣可測量情緒的美國Affectiva公司,能夠通過人臉對情緒進行分析,幫助廣告主理解他們的消費者。

不過現實中,面部識別運用更廣泛用於安保系統。以色列面部識別公司Faception稱,其軟體能夠識別出2015年巴黎襲擊案中的9名恐怖分子(共11人),而《華盛頓郵報》報道稱,至少有一個美國政府國土安全機構採購了Faception的面部識別技術,費用達到75萬美元。

對於識別潛在犯罪者,中國國內也有類似研究,2016年11月,上海交通大學武筱林教授和他的博士生張熙曾發表了題為《基於面部圖像的自動犯罪概率推斷》的論文,展示容貌與犯罪之前的關聯。

中國學者運用計算機視覺和機器學習技術檢測了1856張中國成年男子面部照片,其中近一半為已定罪的罪犯。通過機器學習,分類器區分罪犯與非罪犯的準確率最高可達89.51%,此外,他們發現在內眼角間距、上唇曲率、鼻唇角角度這三個測度上,罪犯和非罪犯存在較為顯著的差距,罪犯的內眼角間距要比普通人平均短5.6%、上唇曲率大23.4%、鼻唇角角度小19.6%。

在北京,政府在公租房小區推行了人臉識別門禁系統。不過與前者通過使用機器學習來訓練演算法,以檢測某些類型的人群和特質不同,現實中的常見應用主要是將面部數據與現有資料庫匹配,用於安全和身份驗證,阿里巴巴刷臉支付也是運用同樣的原理。

北京中海投資管理有限公司負責北京市海淀區人臉識別系統開發,其項目經理孫玉鴻介紹,該項目也是基於深度神經網路技術,通過在單元門口放置攝像頭採集進出住戶信息,與預先錄入的住戶面部數據進行關聯分析,並定期將結果上報房管局,以此對轉租和轉借行為起到預警和取證作用。

專家呼籲建立糾錯與修正機制

應當如何掌控平衡技術發展帶來的變革?中國社會科學院哲學所研究員段偉文認為,目前關於此類技術應該探討的是:這個技術會被誰需要、可以用在什麼方面、可能對誰造成傷害,然後在此基礎上揭示其中的價值和倫理問題,進而建立起動態的糾錯與修正機制。

段偉文認為,在長期技術積累和巨量資本投入的推動下,目前人工智慧技術和產業的發展趨勢呈現出難以阻擋之勢,並將變革人類的物質與精神生活方式,其發展也是國家管理、社會治理的需要。作為面部識別基礎的人工智慧技術是一種靠數據驅動的感知智能,這種感知智能可以通過聚類、相關性分析等方法辨識人的面部特徵、建立起面部特徵與人的身份、人格、情感、傾向的相關性。但在此過程中,一方面,存在著演算法的不透明、不可解釋和難於追責等問題;另一方面,對於數據的採集、處理、標誌和應用中的價值和倫理問題尚未得到充分的剖析和討論。對於這些方面的問題,我們也需要有清醒的認識,並對此進行深入的探討和廣泛的討論。

而就面部識別觸及隱私而言,段偉文介紹,由於歐洲國家經歷過宗教戰爭和法西斯人體試驗對個體的嚴重侵害,因而非常重視個人尊嚴和隱私,為此在可能影響到人技術的研發和應用中,企業首先需要證明其沒有侵害使用者的隱私權和其他權利。美國的科技治理往往更多地顧及企業的利益,法律規定相對寬鬆,企業若未被人投訴侵權就可以進行相關研究與創新。但同時,由於受其清教徒傳統影響,美國有很多由企業組成的自治群體制定了較高的行業倫理標準,在很大程度上彌補了法律上的不足,也使得他們在倫理和法規更嚴苛的區域的貿易中免於倫理和法律衝突。

「雖然在亞洲和中國文化傳統中,對於隱私的重視程度並不高,但由於技術應用日趨無國界,技術雖然在不同地區應用,但存在遵從原則,不論是作為創新者還是利害相關者,均需要按照較嚴格的標準來進行技術,如果要想在人工智慧領域尋求可持續的創新,其社會應用首先要有利於提升公眾的福祉,其價值取向與倫理訴求必須是公眾可以接受的,對於隱私的重視度和倫理標準不可能一隻維持在很低的水平。」他指出。

「目前大多數的面部識別研究是在推動相關識別技術的進步。」王軼倫說,一些中國的公司,如北京曠視科技有限公司旗下的新型視覺服務平台Face++、北京商湯科技(Sensetime),以及某些學者專家,在這項技術方面能夠引領世界。「而用人臉對個人特徵的預測,目前主要是在對相關性的分析,這些研究針對不同的特徵進行分析能夠產生不同的意義。」


推薦閱讀:

教你如何鑒別春、夏、秋茶
教你鑒別十大名茶
15個細節鑒別他會不會疼人,你覺得可靠嗎?
常見水晶發晶的種類及鑒別
如何鑒別普洱茶的好壞

TAG:同性戀 | 隱私 | 同性 | 學者 | 利用 | 鑒別 | 特稿 |