標籤:

這家大數據公司,竟是英國脫歐與特朗普當選的背後功臣

2016年8月18日,特朗普在Twitter上發了一條口氣神秘的帖子:很快你們就會管我叫「退歐先生」。彼時,觀察人士已經注意到他的競選歷程和贏得公投勝利的英國退歐運動有驚人的相似之處,可很少有人想到,這些相似和他的助選團隊有什麼必然聯繫。

參選以來,特朗普的言論明顯前後矛盾,他的變化無常飽受批評,也傳遞了一系列爭議不斷的信息,可一夜之間,這些都變成他的巨大優勢:他給選民傳遞了令人耳目一新的訊息。

在特朗普發帖自封「退歐先生」當月,《數學殺傷性武器》的作者、數學家凱西·奧尼爾評價,特朗普的行為與追蹤觀眾反應的計算機程式完全合拍,一舉一動好像都是由這類投機的程式設定。

特朗普真有那麼神?謎底在2016年9月悄然揭曉:距美國大選正式拉開帷幕一個月,在紐約君悅酒店舉行了一場堪稱小型世界經濟論壇的康科迪亞峰會。Cambridge Analytica公司的首席執行官亞歷山大·尼克斯(Alexander Nix)上台後,一時間全場鴉雀無聲,此人正是特朗普的新任數字策略負責人。

特朗普去年6月聘請了 Cambridge Analytica來幫助他競選,這家公司擅長的就是大數據分析人的心理和性格。

Cambridge Analytica公司CEO亞歷山大·尼克斯。

背後功臣尼克斯與他的秘密武器

在攜手Cambridge Analytica以前,利用數字技術為特朗普造勢的實際上只有曾創業失敗的數字廣告業人士布拉德·帕斯凱(Brad Parscale),他花了1500美元搭建了一個簡陋的特朗普競選網站。特朗普的個人助理透露,古稀之年的特朗普不了解數字領域,他平時不收發電郵,用上智能手機也是助理苦勸之後的事,現在他就用那隻手機不停發推。

相較之下,希拉里當時已經相當依仗美國史上首位「社交媒體總統」奧巴馬遺留的寶貴財富。同為民主黨人的希拉里接掌了他馳騁社交媒體的所有資源。競選期間,她不僅與奧巴馬麾下數據分析團隊資深成員創立的 BlueLabs Analytics, Inc. 公司的一流大數據分析師合作,還得到了谷歌和夢工廠的支持。

當特朗普2016年6月宣布聘請 Cambridge Analytica時,設在華盛頓的 BlueLabs還嗤之以鼻。他們的第一反應可能是:真的假的?一幫穿著定製西裝的外國佬能了解美國、懂得美國人的心理嗎?

事實上,為特朗普助陣並不是Cambridge Analytica登陸美國的處女秀。這家公司兩年之前就試水美國大選,在得到特朗普垂青以前,它曾先後擔任另外兩位共和党參選人卡爾森和克魯茲的顧問。

Cambridge Analytica的大金主是低調的美國軟體業富豪、對沖基金文藝復興基金的聯席執行官羅伯特·默瑟爾( Robert Mercer)和他的女兒。據報道,默瑟爾是該公司最大的投資者。

更何況,早在2015年11月,前英國獨立黨領導人奈傑爾·法拉奇支持的激進退歐組織「離開歐盟」就請Cambridge Analytica協助線上宣傳。這家公司擅長創新的政治推廣方式,基於OCEAN(五大類性格——開放型、嚴謹型、外向型、親和型、神經質型的簡稱)模型,通過人們留在數字領域的足跡測量其個性,細分目標受眾。

所謂的OCEAN就是:Openness to experience——經驗開放性,好奇和對新體驗的接受程度;Conscientiousness——盡責性,是否容易被傳統的目標驅動而專註工作;Extraversion——外向性,是否更傾向於活躍於社交場合;Agreeableness——親和性,是否傾向於與群體達成一致和合作;Neuroticism——情緒不穩定性,對未知和壓力環境的反應是否穩定。

尼克斯在康科迪亞峰會上做了一場精彩的演講。他在會上開門見山地談了談「大數據和心理測量學在大選中的威力」。他先舉了泰德·克魯茲的例子。他說克魯茲一年半前人氣不高,知道他的美國選民人數不到40%。2016年4月,克魯茲的民調支持率已經和特朗普難分高下。

尼克斯解釋,其他助選機構都依靠性別、種族等人口統計學的要素,想當然地覺得只要是女性、或者只要是非裔美國人,對候選人的印象應該都是一樣的,而他的公司運用心理測量將選民劃分為五種性格的人,利用OCEAN模型預測所有美國成年人分屬哪種性格,然後有針對性地向不同每種性格的人展開儘可能符合他們口味的宣傳。

Cambridge Analytica公司。

簡單解釋OCEAN模型的操作方式。首先,從多種多樣的來源購買個人數據,比如土地登記、汽車數據、購物數據、積分卡和俱樂部會員信息,了解他們讀哪些雜誌,去哪些教堂做禮拜。在美國,幾乎所有個人數據都可以待價而沽,Acxiom、Experian等經紀商都面向全球踴躍出售數據。

綜合這些購買的數據和共和黨的選民名單,以及網上的數據,Cambridge Analytica就能測算一個選民屬於五大類中的哪種性格。至此,零亂的數字足跡突然之間就可以呈現現實生活中人們的擔憂、需求、興趣和住址。

接下來,尼克斯在PPT中演示了他們為克魯茲競選準備的數據分析圖表集合。尼克斯縮小了地圖展示的數據範圍,隨著他逐步取消「共和黨人」、「尚未確定者」「男性」等顯示標準,最後,地圖上只留下了人名的信息,包括年齡、地址、興趣、個性和政治傾向。

尼克斯以美國憲法第二修正案的槍支使用權為例,展示了Cambridge Analytica如何對特定的選民提供適當的政治訊息:如果是神經質型和嚴謹型觀眾,就要突出入室搶劫的威脅,顯示政策應該保證業主持槍,所以可以讓他們看看這種畫面:搶劫者一隻砸窗戶的手;另一邊,要是封閉的親和型人,他們關心傳統、習慣和家庭,不妨給他們看類似大人帶著孩子站在夕陽下舉槍打野鴨的畫面。

尼克斯在演講中坦言:「特朗普發的幾乎所有Twitter帖子都背後都有數據支持」。他透露,在特朗普和希拉里進行第三場總統辯論那天,特朗普的助選團隊通過Facebook這個平台測試了17.5萬條宣傳特朗普觀點的不同廣告,以便找到其中適合的版本。

為了從心理學角度儘可能地找准目標觀眾,這些接受測試的廣告大多只是在微小的細節方面有差別,比如圖片或者視頻的標題、用色、字體有所不同。尼克斯說,經過這種細微的調整,特朗普的廣告能覆蓋哪怕最小的受眾群體。他在Das Magazin的採訪中透露:「我們可以有針對地搞定小到村鎮或者公寓區,甚至具體個人。」

狙擊希拉里:消滅她的潛在支持票

以邁阿密市一個叫「小海地」的海地裔黑人聚居區為例。為了阻止該地區的選民投票支持希拉里,特朗普的團隊就在當地散布消息,曝光海地發生地震後希拉里與丈夫創辦的柯林頓基金會濫用救災款等惡劣行徑。一位助選的高官在大選日幾周前告訴彭博新聞社,這麼做是為了阻止非裔美國人、年輕女性、搖擺的左翼人士等希拉里的潛在支持者為她投票。

這些抹黑希拉里的帖子會出現在Facebook的時間軸廣告中,只有符合某些性格特徵的選民才能看到,比如非裔美國網民會看到希拉里稱黑人為「捕食者」的視頻。

演講結尾,尼克斯說,鋪天蓋地打廣告的傳統模式已經壽終正寢,沒有人能再忽略具體的受眾。

事實上,即使尼克斯主動揭開了神秘的面紗,人們也無法確切了解特朗普的助選團隊瞄準了哪些美國選民,因為他們主攻社交媒體或者數字電視的個人化訊息,重心並沒有放在主流電視頻道上。雖然當時希拉里的團隊根據人口統計預測己方領先,但彭博記者薩莎·伊森博格在參觀美國人口第七大城市聖安東尼奧後發現,這個特朗普團隊做數字領域推廣的基地已成為特朗普助選的「第二個大本營」。

別看Cambridge Analytica為特朗普效力的只有12人,從2016年7月到9月,他們得到的酬勞已經完成了三級跳,分別拿到10萬美元、25萬美元和500萬美元。尼克斯介紹,僅特朗普這個客戶就為公司帶來超過1500萬美元收入。

重賞之下必有回報,特朗普的團隊引進了前衛的測量指標:從2016年7月起,他們給助選拉票的工作人員配備了一款能辨識住戶政治觀點和性格類型的應用。英國退歐的支持者也曾用過這種應用。

如此一來,拉票者便能有的放矢,只需拜訪那些被歸類為會接受特朗普觀點的人。登門以前,拉票者會帶上根據受訪者性格類型事先準備的對話提綱,實際交流以後,他們會將受訪者的反應輸入應用,特朗普的團隊就會得到新的反饋數據,更新相關的數據綜合圖表。

雖然民主黨也搞上門拉票,但沒有證據顯示他們依靠心理測寫有針對性地展開攻勢。

傳統的傳媒策略和手段往往陷入了僅從地理和人口學的分類出發的陷阱,而Cambridge Analytica的獨門絕技在於,他們注重心理檔案建立,根據性格,對選民進行行為精準投放(Behavioral Microtargeting)。

個人的人口統計類別可能一致,但性格不一樣

兩個人口統計學分類一致的個人,由於性格區別很大,同樣的信息投放,對他們起到的效果可能會有天壤之別。Cambridge Analytica公司將美國國民分為32種不同性格的人,而且鎖定人群僅限17個州。他們發現,偏好買國產車的美國民眾可能就是特朗普的選民。

除了這種指向性很強的信號,他們還利用發現摸索出特朗普發哪種帖子最有效、對哪些地域的人最有效,並且根據數據分析做出決定,在大選衝刺階段著重做密歇根州和威斯康星州的工作。堂堂美國元首的候選人就這樣成為讓大數據模型得到現實應用的工具。

OCEAN五型人格之父的警戒

政界人士對Cambridge Analytica的作用還將信將疑,但OCEAN模型之父——心理學家邁克·科金斯基(Michal Kosinski)對大數據的潛在危險及這家公司的巨大潛能就再清楚不過了。

科金斯基和Cambridge Analytica頗有淵源。

2009年,在劍橋大學心理測試中心攻讀博士一年後,科金斯基和同學大衛·史迪威聯手開發了一款應用 MyPersonality,當時Facebook還沒有成氣候,這款應用讓用戶接受不同的心理測驗提問,包括五類性格相關問卷的一些心理問題,然後,用戶就能得到一份個人性格綜述,並且可選擇與研究人員共享自己的Facebook數據。

通過這種方式,科金斯基不久得到了幾百萬人共享的數據,意外地掌握了全球最龐大的Facebook個人簡介及心理測試評估數據集。

此後幾年,科金斯基和同事進一步簡化了方法。首先,他們請測試對象在網上完成一份調查問卷。根據問卷回答,這些心理學家測算受試者分別屬於五大類性格(開放型、嚴謹型、外向型、親和型、神經質型)中哪一種類型,然後用測算結果和這些受試者在互聯網留下的其他各類數據做對比,比如在Facebook上分享點贊的內容或者發的帖子,他們自述的性別、年紀、所在地。通過這種比較,研究者可以將分散的信息聯繫起來,找出相關性。

通過觀察一個人在網上的活動,可能推測出非常靠譜的結論。比如為彩妝品牌M.A.C點贊的男士較有可能是同性戀,關注Lady Gaga的人很可能是外向型人,而那些為哲學話題點過贊的人往往性格內向。雖然單一信息說服力太低,不足以進行可靠的推斷,但要是把成千上萬的單個數據點彙集到一起,就可以得到正確推測。

2012年,經過不懈努力,改進模型,科金斯基證明,根據一名用戶平均每68個在Facebook網站的點贊,就可能推測該用戶的膚色、性向、傾向支持美國民主黨還是共和黨,準確率分別高達95%、88%和85%。不僅如此,通過點贊還能推測用戶的智力水平、宗教偏好、是否飲酒、抽煙和吸毒乃至父母是否離異。

更有甚者,它們能披露用戶的一些線下狀態,因為手機可以顯示用戶的移動速度和距離。科金斯基的結論是,智能手機就是一份我們有意無意隨時在填寫的心理問卷。

兩年後,一位名叫亞歷山大·科根的心理學系助教找到科金斯基,代表一家簡稱SCL的公司向他諮詢心理測試分析方法,並希望能使用MyPersonality的資料庫。科金斯基的團隊起初考慮接受請求,因為那樣一來研究中心可以得到大筆資金,但後來他上網搜索了一下這家全球戰略傳播實驗室的SCL公司,發現該司自稱根據心理模型做推廣,一項核心業務是影響選舉,這讓科金斯基起了疑。

他的直覺是準確的:SCL旗下有多家公司,其中一些參與了烏克蘭和奈及利亞等國的選舉,幫助尼泊爾王室鎮壓叛亂,還有些子公司提供方法影響東歐和阿富汗國民對北約組織的看法。2013年,SCL分拆,誕生了一家涉足美國大選的新公司Cambridge Analytica。

當時科金斯基對此一無所知,但他已經有了不祥的預感。經過進一步調查,他發現科根秘密註冊了一家公司和SCL開展業務。科金斯基開始懷疑科根的公司可能複製了自己原創的五型人格測量工具並把它賣給SCL,於是迅速中斷了與科根的聯繫,並通知了所在的研究中心,劍橋大學為此出現內訌。後來,科根移居新加坡並更名,科金斯基修完學位得到在斯坦福工作的機會,西去美國定居。

科金斯基以為此事已告一段路,直到2015年11月「離開歐盟」宣布委託Cambridge Analytica幫忙做線上宣傳。Cambridge Analytica乍看上去滿是劍橋、性格、分析這些字眼,很多人一下子就想到了科金斯基。於是科金斯基開始收到大量電郵,人們追問他會拿出什麼鼓吹退歐的行動。可這是他第一次聽說Cambridge Analytica。

看著Cambridge Analytica的官方網站,科金斯基一臉驚恐,他的分析方法是不是大量用來為政治服務了? 英國公投退歐後,親朋好友又寫郵件給科金斯基:看看你做的好事。無論去哪兒,他都不得不給人解釋,自己和Cambridge Analytica毫無關係。當然,這家公司是不會主動出來澄清,或披露它在英國退歐的活動中出了多少力的。

此後,無論是英國《衛報》於2015年12月刊發的報道,還是Das Magazin得到的公司內部文件都指向一個結果:SCL從科根處學到了科金斯基的方法,就連尼克斯在2016年那場康科迪亞峰會上講解的方法也和科金斯基發明的極為相似。

尼克斯那時告訴現場聽眾,Cambridge Analytica同樣採用社交媒體的調查和Facebook的數據。他聲稱:「我們已經描繪出全美所有成年人——2.2億人的個性」--而這種吹噓恰恰是科金斯基此前警告人們大數據的危險之處。

科金斯基實質上發明了一種人肉搜索引擎。隨著研究深入,他開始認識到這種搜索引擎的潛力,同時察覺到自己的研究有危險的一面。

在他看來,互聯網一直都是天賜的禮物,他衷心希望利用互聯網回饋社會,實現共享。這是整整一代人的理想追求,它為一個超越物質世界的新時代拉開了序幕。但科金斯基越來越擔心,假如有人濫用自己的搜索引擎操縱他人,那將怎樣?他開始在大部分研究論著中加上警語。他警告所有讀者,這種方法「可能對個人的幸福、自由甚至人生造成威脅。」 可惜當時沒人真正理解他的苦心。

心理測量方法會控制一切嗎?

到底心理測量方法對選舉結果有多大影響? 這個問題可能無解,但也並非無跡可循。克魯茲在黨內初選中令人大跌眼鏡的崛起,投票的鄉村選民日漸增多,早期投票的非裔美國選民減少,以及特朗普競選相對較少的花銷,或許也可以歸功於性格分析模型。

和希拉里相比,特朗普在數字領域的投入遠超電視廣告,而尼克斯與多位特朗普競選班子的核心成員也曾多次表示,Facebook是總統競選期間最強大的助選利器。不過,Cambridge Analytica不願提供任何可以證明其效力的數據。

很多人斷言,統計學家在這次美國大選中一敗塗地,因為他們的預測錯得離譜,可他們有沒有想過,統計學家實際上也是贏得大選的功臣,只不過,只有那些運用新方法的統計學家才是功臣?

Cambridge Analytica無疑是這次競選的另一大贏家(該公司董事史蒂夫·班農曾是右翼報紙 Breitbart News的執行董事長,現任特朗普的高級顧問、首席政治策略師)。目前,Cambridge Analytica公司正在巡迴歐洲出席活動,展示在美國取得的成就,據悉,他們已經收到來自瑞士、德國和澳大利亞的業務諮詢。

今年法國、荷蘭和德國都將舉行大選,民粹主義政黨又都在這三大歐盟核心國家死灰復燃。在這樣的背景下,美國大選的成功正是一場及時雨,為Cambridge Analytica殺入商業廣告領域奠定了基礎。

反觀學術界,美國大選落幕後,斯坦福陷入動蕩。科金斯基選擇以一位研究者最鋒利的武器——科學分析應對。他和同事桑德拉·瑪茲一道進行了一系列測試(研究成果即將發表),初步測試結果已然驚人:研究顯示,通過在Facebook網站提供匹配消費者個性特徵的產品和推廣信息,相關產品和推廣語的廣告點擊量可提高63%,相關線下廣告活動的諮詢對話也增加了1400例,這足以體現針對不同個性推廣的效力。

科金斯基和同事進一步展示了個性化定向推廣的影響力。他們發現,大部分Facebook推廣產品或品牌的頁面都受到消費者的性格影響,根據某個Facebook頁面就可以精確鎖定龐大的消費者群體。

本文德語版的相關調查報道發表後, Cambridge Analytica的發言人發布聲明,否認公司利用Facebook的數據:

「(本公司)與邁克·科金斯基博士並無業務關係,並非從事轉包研究,也不曾運用和科金斯基相同的方法,根本很少用到心理測試。我司不曾致力於阻止任何美國國民在美國大選期間投票,所有工作只是為了增加選舉的投票者。」

但反觀現實世界,我們面對著是一個的的確確天翻地覆的世界:英國退歐,特朗普就任美國總統,世界民粹主義蠢蠢欲動,全球化退潮……

當年科金斯基開發的心理測評模型不危險,它只是揭示了危險的存在。

文 章 來 源:DT學院 -DT學院,有溫度、有態度的大數據資訊媒體

微信公眾號:idtted

weixin.qq.com/r/Q0iZgX- (二維碼自動識別)

推薦閱讀:

我們每天面對的屏幕正悄悄改變世界
大數據、沉浸式學習、物聯網……美國教育從業者眼中的2018年七大教育科技趨勢
2018智能周報 | 02.17-02.25 | 附資源地址 | AI作惡、CVPR會議、IBM量子計算揭秘……
鹿豹座平台(1.8-1.12)大數據新聞每周精選
大數據學習筆記:Hadoop之HDFS(下)

TAG:大數據 |