除去「惡」的一面:劍橋分析公司給AI產業何種啟示?

日前,由於Facebook平台用戶的數據被非法採集和利用,一時間全球社交媒體老大成為眾矢之的,而隨著整個事件的始作俑者劍橋分析(Cambridge Analytica)公司更是遭到口誅筆伐。那麼我們今天去除上述事件中「惡」的一面,僅從AI技術、市場應用的角度來看劍橋分析可能會得到另外的啟示。

眾所周知,所謂劍橋分析採用的對於搜集到的個人信息分析的計算模型最初是來自於邁克爾?科辛斯基(Michal Kosinski),其是心理測驗學(一個由數據驅動的心理學分支)領域的領軍人物,其發明的個人信息計算模型可以根據簡單的個人信息就推斷出該數據提供者可靠的個性特質。究竟有多可靠?

早在2012年,科辛斯基就證明,平均基於Facebook上的68個「點贊」,就可以預測用戶的膚色(準確度95%)、性取向(準確度88%)以及政治傾向(民主黨或共和黨,準確度85%)。可預測的內容遠不止於此,還包括智力、宗教信仰,以及酒精、香煙和毒品使用。基於數據,科辛斯基甚至可以推斷某人的父母是否離婚。而在不斷研究和改進後,其模型變得日益完善,即僅僅基於10個點贊,他就能比受試者的同事更準確地評價受試者;70個「點贊」足以讓他比受試者的朋友更了解受試者;150個點贊可以讓他比受試者的父母更了解受試者;300個點贊可以讓他比受試者的合作夥伴更了解受試者。基於更多的點贊,科辛斯基對受試者的了解,甚至超過受試者自己。

之後,科辛斯基等人開發了一種非常簡單的方法。首先,他們以在線測驗的形式向測試對象提供問卷。根據他們的回答,心理學家計算了受試者的個人「大五」(開放性Openness,對新經驗的開放程度、盡責性conscientiousness,完美主義程度、外向性extraversion,社交活躍程度、隨和性agreeableness,體貼和合作程度和情緒穩定性neuroticism,焦躁不安程度的簡稱,又稱為OCEAN)分數。 然後科辛斯基的團隊將結果與受試者的其他在線數據進行比較,例如,他們在Facebook上「點贊」、分享或發帖的數據,以及性別、年齡、居住地點等數據。這使研究人員能夠建立特定網路行為與個性特質之間的關聯。

不知業內,尤其是那些整天把大數據、AI掛在嘴邊的企業作何感想?我們看到的是,如果AI真的發揮作用,如何理解AI專攻的領域及在相關領域的專家至關重要,尤其是針對這個領域基礎理論的了解和研究一定要透徹、紮實,因為這直接影響到計算建模的水平和其輸出的結果(是否真的具有價值)。那麼以此作為標準之一的話,我們國內號稱自己是AI企業的有多少是合格的?又有多少是渾水摸魚的?也許就像我們有的業內人士所言,我們偌大國家不缺少用戶的數據,但如果技術不過硬,這些數據又有何用呢?又有什麼值得炫耀的?

其實此前,某些號稱採用AI技術的國內企業在向所謂的目標用戶推送內容、廣告、服務的時候已經引發了用戶的不滿,甚至鬧出一系列的笑話,原因很簡單,就是推送的這些根本不是這些用戶所需要的,更反映出這些企業AI技術與人家的差距。

如果說科辛斯基為某種AI應用奠定了堅實的技術基礎,那麼此次被曝光的劍橋分析公司則是為這種技術找到了最佳的應用並實現了最佳的效果,即政治選舉。這也是為何外界又稱劍橋分析是政治AI公司的原因。

例如在歐洲,劍橋分析幫助曾在上世紀80年代獲得成功的復興政党參與了2012年義大利政治競選活動,而其改革建議使該黨的表現超出了最初的預期;2014年幫助烏克蘭展開顏色革命,使親西方總統維克多?尤先科(Viktor Yushenchenko)掌權;在肯亞,劍橋分析公司曾兩次用於幫助肯亞總統烏胡魯?肯亞塔(Uhuru Kenyatta)先後在2013年和2017年獲得選舉勝利。當然除此之外,最大應用就是其在英國脫歐的投票中讓英國脫歐及特朗普在美國總統大選中擊敗希拉里當選。

提及美國總統大選,我們補充說明的是,其實除了特朗普,其競爭者希拉里也採用基於大數據的AI分析,即與來自藍色實驗室(BlueLabs,2013年在華盛頓創辦的一家數據分析和技術公司,創辦人包括奧巴馬數據團隊的高級成員)的前沿大數據分析師合作,並獲得了谷歌和夢工廠(DreamWorks)的支持,甚至當特朗普於2016年6月宣布聘請劍橋分析時,希拉里陣營還嘲笑該公司AI分析準確性肯定不及本土的藍色實驗室。但最終的結果證明,這兩家同樣基於AI技術的分析公司,顯然劍橋分析更高一籌,這似乎再次證明了AI技術本身與適用市場的重要性。

不過這裡我們再次強調,我們堅決反對和譴責劍橋分析干預別國政治的做法,只是藉此說明AI要真正發揮價值和作用,技術過硬和應用對口(要易於最大化技術的價值)的不可或缺。相比之下,還是我們國內的某些AI企業,總是把自己的AI技術吹得天花亂墜,無所不能,其實針對不同的行業,不同的市場,AI也是有專攻的,盲目的選擇應用和市場,不僅事倍功半,甚至有噱頭的嫌疑。

最後就是通過劍橋分析,我們重新認識了英國在AI領域的實力。其實,AI不僅是美國在引領未來。過去十年,英國一直是歐洲AI的研發中心,AI創業公司屢獲谷歌、亞馬遜、蘋果等巨頭青睞,併購和投資消息不斷。這裡我們不妨簡單看看英國在AI方面有哪些知名的公司或者初創企業,它們在幹什麼?

提及「阿爾法狗」打敗世界圍棋冠軍李世石成為大量媒體的頭條新聞,相信有部分人會認為這是谷歌AI牛逼的代表,實際上「阿爾法狗」的開發商是成立於2011年的英國DeepMind公司。該公司由神經系統科學家Demis Hassabis、網路語音通訊軟體Skype開發者Jaan Tallin和研究人員Shane Legg共同創辦,是前沿的人工智慧企業,其將機器學習和系統神經科學的最先進技術結合起來,建立強大的通用學習演算法,只是在2014年被谷歌以4億美元收購。

再看當下火爆的自動駕駛,除了經常見諸報端的美國科技企業谷歌、Uber、特斯拉外,其實英國在自動駕駛上也早有涉足。例如2014年末從牛津大學機器人團隊中衍生的Oxbotica公司,就專註於機器人和自動駕駛汽車工程技術的研究。其開發的自動駕駛軟體Selenium可以通過搭載的視覺攝像頭、激光掃描器或者雷達系統獲得數據。通過一系列演算法確定自身的位置和周圍的環境狀況,進而判斷下一步的行動,實現自動駕駛。該軟體系統具備自主學習能力,它會在行駛過程中收集數據並進行分析和學習,以此訓練感知系統並獲得自主駕駛能力。此外,劍橋大學SegNet研究小組,其開發的高性價比的自動駕駛識別系統SegNet,具有低成本低特性且不需要任何GPS連接,無論是白天還是黑夜,都可以正常工作。一旦SegNet系統啟動,便可臨時接管汽車的基本操作,這一功能與部分車輛的自動駕駛功能類似。SegNet系統還可識別道路、建築物、電線杆、路牌、行人和騎行者等12類標註。可保持實時工作狀態並在較短時間內對各種新圖像進行評估,精確度高達90%。

更讓我們吃驚的是,英國現在已經開始研究量子計算與AI的結合,而Cambridge Quantum Computing Ltd.就是一家在量子信息處理技術,人工智慧,優化與模式識別相結合的領先獨立公司。該公司開發可實現當前或未來工業的技術,專註於量子器件的演算法和數據協議。該公司目前關注的領域包括:量子操作系統與量子模擬、認證隨機性、人工智慧、安全認證和量子對抗加密貨幣。

看到這些,再結合近期外媒屢屢發文稱中國AI水平正在趕超英美,我們是否應該冷靜下來思考,這背後的目的究竟是什麼?實際的情況又是怎樣?

綜上所述,我們認為,當業內將目光紛紛聚焦到Facebook和與之相關的劍橋分析非法搜集和利用用戶數據用於左右別國政治選舉負面的時候,我們不妨站在AI產業的高度,從技術和應用的角度去看待這一事件,提取出對於我們AI產業發展有利的啟示也同樣具有重要意義,畢竟任何事物都具有兩面性。


推薦閱讀:

Facebook 深陷泥潭,扎克伯格打不好的廣告牌
為什麼 Facebook 移動端廣告收入能夠達到總體廣告收入的 87%?這個比例還會增長嗎?
馬克·扎克伯格在 Facebook 早期做出的最重要的決定有哪些?
從馬克·扎克伯格的 Facebook 賬號泄漏的隱私照片來看,馬克在生活中是個怎樣的人?
如何在iphone6上下載facebook收藏視頻?

TAG:Facebook | 劍橋大學UniversityofCambridge | AI技術 |