你悄悄搜了啥,給誰點了贊,他們統統都知道…

上周末,英美兩國的媒體,爆出了一則與Facebook臉書有關的大新聞。

報道稱,一家名叫Cambridge Analytica劍橋分析的數據分析公司,通過為臉書平台開發的性格小測試程序,收割了超過5000萬的用戶數據。

並且,利用這5000萬用戶,操縱了2016年的美國大選

(圖源:Telegraph)

大概意思就是,這個公司針對每個用戶的特點,尤其是那些偏中立不知道投誰的選民,投放洗腦政治新聞,進而最終將川普推向大選勝利。

(圖源:Telegraph)

利用大數據給人洗腦?還影響選舉?小小的一個臉書賬號也能搞出這麼多事兒?比起波瀾詭譎的政治鬥爭,俄羅斯陰謀,在鋪天蓋地的報道中,我更在乎的是這個案件背後隱藏的大數據危機。

先給大家講一下,它們如何抓取用戶信息,又是如何操縱大選的大概過程:

2014年夏天,這個公司和一位劍橋的研究人員合作,展開了一項研究,抓取了大約32萬用戶的核心數據,這些用戶的喜好,性格和交友圈信息,一覽無遺。

(圖源:YouTube)

在媒體披露的內部交流郵件中顯示,各種用戶信息從性別到智商,從政治傾向到工作信息,甚至臉用戶是否自律嚴謹,都能夠一一分析出來。

(圖源:NYT)

具體如何操作,都基於劍橋大學研究人員Kogan開發出的一款,基於臉書平台的性格測試小程序「這是我的數字生活」。

Kogan和他的團隊,以學術研究為名義,向參與測試的人,有償徵集所謂的測試答案,還在網站買廣告位,推薦此款小程序。

實際上,在回答個人性格隱私的問題時,進入測試後,每一個使用者,都必須向第三方授權自己的臉書信息。似乎是一個我們平時經常遇到的畫面,好像並沒有什麼大不了的。

示意圖 (圖源:Facebook)

第三方,就是Kogan所代表的小程序背後的劍橋分析。而授權的信息,不僅僅是參與測試用戶的朋友圈信息,還包括他們朋友的資料。

據估計,每一個使用者都會帶來額外的160位朋友的信息數據。

測試結束,他們拿到了接近32萬個原始用戶數據,然後每人至少160的好友,32萬*160 = 5100多萬!

這是個龐大的數字,2016年美國大選總有效票數也才1個多億多一點,這5000萬的作用有多大,可想而知。

(圖源:FB)

(圖源:Social)

得到這些數據的劍橋分析,建立了大型的分析模型,逐個分析用戶的個人喜好和政治傾向。

這也被他們稱為「Personality profiles性格資料」。在這些資料里,用戶的教育信息、地理位置、喜歡的頁面、情感狀況、工作狀況等都一一被記錄下來。

接下來,便開始了「定製化」的洗腦過程。川普的競選團隊,從臉書的廣告,和新聞推送計算出發,將有利於自己的消息和新聞定向,推送給潛在選民。

不知道投票給誰?Okay,給你推送希拉里的負面新聞,植入希拉里不行的概念。

我舉個簡單的例子,我們都知道希拉里是贊同接納難民的,

如果據數據判斷,一個用戶他經常點贊批判接納難民的相關內容,或者從該用戶的交往人群,信仰等線索蛛絲馬跡,大概推斷此人反移民或者不支持接納移民,

那麼對他的主頁頻繁推送希拉里「接納移民」的觀點新聞,勢必會讓該用戶產生對希拉里的反感。

(圖源:Facebook)

喜歡聳動新聞?沒問題,專門給你發送「震驚」類的內容,一次管飽。

(圖源:Facebook)

當用戶在潛移默化中,每天被推送閱讀這些定製類的新聞時,你很難說他們不被影響。在大數據幫助下,川普團隊潛移默化地影響了很多選民,這也成了他登上總統之位的強效助力。

(圖源:NYT)

這一切,直到上周末,才被劍橋分析的前員工Chris Wylie揭露給公眾,震驚世人的同時,也把臉書打的措手不及。

除了小扎被各種質問以外,臉書首席安全官決定辭職,英美兩國的法律機構也紛紛計劃問責。臉書的股價也在一天之內暴跌,小扎的身價縮水了60億美元。

事實上,Facebook這種事,影響的不止是選舉這樣的大事件。大數據還在操縱我們每個人生活的方方面面。

首先,我們得談談大數據到底是什麼?

簡單來說,大數據就是利用海量信息,找到其中不易被人察覺的關聯,並利用這種關聯的分析方法。

想要從大數據中獲利,離不開收集和分析信息。收集信息早已過了大張旗鼓搞調查的時代,現在的數據公司,已經都能做到無聲無息地了解我們的生活。

這些公司做的第一步,就是收集數據。

我們在網路上的所有行為,每一次點贊,每一次分享,每一次瀏覽,都將成為被記錄分析的數據。

(圖源:uxpassion)

當代人手機電腦不離手,只要連接了網路,我們就在留下痕迹。

搜索引擎成了我們聯通網路的大門,每次搜索,都會被看門的數據公司,記錄下我們往哪個方向走。

(圖源:elegenttheme)

搜索過遊戲,就給你推薦遊戲;消費過護膚用品,就給推送同類型產品;轉發過汽車新聞,就給推薦汽車。

這種利用cookie搜集數據的方式,其實不是很新的技術了。最早的cookie在1994年就被設計出來了,最初只是想讓用戶在自己的電腦上,記錄訪問伺服器時的狀態。

現在的cookie也是一樣的功能,大家訪問購物網站的時候,網站在你的電腦上記錄下你瀏覽的信息,再次打開這個網站時,網站就可以讀取cookie了解到你之前做了什麼。

比如有東西加到購物車還沒結賬,再進入網站時購物車自動恢復,或者看的小說看到一半,再打開網站時自動找到上次讀到的位置。

(圖源:machinedesign)

本來這項技術是為了提供更好的客戶體驗,讓大家瀏覽網站時,不需要一次把所有的事情都做完。然而,這個技術被廣告商盯上了,掌握了我們網上的一舉一動。

通過讀取cookie,廣告商可以知道我們看過什麼網頁,看了多久,操作到什麼地步。

除了讀取cookie,數據公司還會收集用戶的個人基礎信息、點贊、社交圈、消費習慣和生活習慣,也就是Facebook這種公司從我們身上拿到的資料。

集齊了他們需要的信息,這些公司就開始對這些數據進行分析。

這個分析的過程,叫做用戶畫像。

用社交網站上的各種資料,配合用戶在網上的瀏覽信息建立模型,用模型運算預測用戶可能發生的行為。

(圖源:sdtimes)

比如用戶最近發了一大筆獎金,平時又在瀏覽包包,通訊錄里還新加了幾個代購,這種條件就可以預測用戶買包的概率相當大,符合買包人群的普遍行為特徵。

廣告商根據這些分析結果,就可以預測我們可能會買什麼,進行定向投放廣告。

報姐在工作室里調查了一下小夥伴的手機,不同的年齡,婚戀情況,手機型號,學歷的人群的確會收到不同的廣告推送。

比如,這就是一個工作室里玩遊戲,有駕照的男生近期收到的定向廣告:

然而,這種推薦演算法還只是初級,現在的公司收集信息,分析數據的能力已經進化到讓人防不勝防。

它們不僅想知道我們搜索了什麼,還想了解我們的各個方面。

(圖源:xenlife)

乖乖讓用戶交出個人信息不是一件容易的事,我們又不是傻子,憑什麼給這些公司我們的資料。

但是事實證明,道高一尺魔高一丈,為了搞到數據,他們想出各種辦法,哄得用戶樂呵呵地自己奉上隱私數據。

像劍橋分析給每個用戶5塊錢,用戶不僅把自己的東西都交代了,還給了他們許可權去了解自己的朋友們。想想我們,是不是也有曾經為了返券優惠,提供額外資料給某些app呢?

(圖源:metrokids)

雖然是有不少人意志堅定,不為這種小恩小惠所誘惑。即便如此,依然會被數據公司,用各種方法抓取走你的信息。

比如,某大名鼎鼎的情色網站,做的成功不僅是因為它內容豐富,更因為它去通過各種辦法收集用戶信息,從海量片源中,精準推薦用戶愛看的片子。

(圖源:socialunderground)

除了記錄搜索和瀏覽歷史,這個網站想到了一個絕佳的點子獲得用戶的偏好信息:看用戶觀看完後是否關閉窗口。

一段視頻播放後,沒有快進快退,窗口也沒有關閉,說明用戶對這段影片是「滿意」的,正在忙,騰不出手來關閉…

就這樣,用著各種各樣,我們知道或不知道的辦法,個人信息就被搜集走了。不僅是我們的名字年齡,點贊、消費習慣、出行習慣甚至作息時間,都會被收集。

信息越多,通過數據模型分析出的結果越準確。他們甚至可以根據之前的消費記錄,愛好、人脈和消費能力,預測出我們自己都不知道的,在未來會產生的消費需求。

(圖源:sciencebusiness)

這些,利用我們在互聯網上留下的痕迹,進行精確投放,已經讓人不適。更讓人不寒而慄的是,還有些技術像是幽靈一樣,冷冷地監聽窺視著我們的生活。

而這個釋放這個幽靈的魔盒,就是我們所說的:手機許可權

手機系統設計的時候,為了避免用戶信息泄露,同時又防止限制過多,有些app不能正常使用,提供了「許可權」這個概念。

照相的app需要使用攝像頭和存儲照片的許可權,導航app需要定位的許可權,由大家決定讓不讓app使用這些功能。

於是,就有些公司把搜集信息瞄準到了這些app上,他們做一個軟體,就想把用戶的全部信息都得到。授予手機上app一些本不需要開的許可權之後,它可以隨時監測我們的位置,我們的通訊錄,甚至我們的簡訊和電話。

那麼簡單說,許可權就是一把鑰匙,打開我們一切資料的鑰匙。

這兩天在Reddit上有一個討論:在Facebook上曾經受到過什麼讓你覺得毛骨悚然的推薦?

其中就有這麼兩條:

FindingMoi:有個事,不是FB但也非常恐怖:我男票買了一個電腦椅,對他來說有點小,他提到有個大一號的款,但是更貴,所以他不換了。然後當我打開手機,我就收到了一個廣告,給我推送了那把大一號的椅子!正好是我男票喜歡的顏色!(有8個顏色選項,給我推送的是藍色款,就是我男票買過的顏色!)

Two_kids_two_pugs:這事也發生在我身上,一次又一次。有一次,我和我丈夫討論要不要買一個黃色廚房攪拌器。我都沒有搜,或者添加到購物網站的心愿單里。但當我打開APP,跳出來的就是那款黃色攪拌機!

這條微博發布後,有很多網友分享了他們相似的經歷:

除了千方百計竊取用戶信息,定製個人推薦,精準投放,數據還在默默地把我們劃分為三六九,無情殺熟。

前段時間,有微博網友發現,在使用訂機票、訂酒店,打車、買電影票,叫外賣這些互聯網平台服務時,老用戶常常需要比平台新用戶支付更高的價格。

類似的情況還有:

根據出行路線記錄,同樣路線和車型,老用戶要比新用戶貴上六七塊;

選機票,看電影這種票務服務,選好後取消再預定,價格立漲甚至翻倍;

搜索比價以後,能看到的產品選項越來越少,最後只剩下商家想讓你看的那幾個;

(圖源:微博)

這種「大數據殺熟「,也就是經濟學上所說的一級價格歧視,廠商(壟斷者)知道每位消費者,對任何數量的產品,要支付的最大貨幣量,並以此決定價格,因而能夠獲得每位消費者的全部消費剩餘。

這曾經在經濟學上,被認為是不可能出現的情況,因為壟斷者無法了解,每一個消費者願意支付的最大貨幣量。然而現在大數據,卻為一級價格歧視的發生,提供了技術支持。

就像是,我們開始說的那樣:大數據,比你更了解你自己。

在大數據面前,我們每一個人都是赤裸的,待宰羔羊。

(圖源:linkedin)

這次Facebook操作選舉的事件,只是揭露了大數據時代危險的冰山一角。

原來,我們看到的世界,不過是大數據為我們精心定製的一隅天地。

大數據,不止了解我們,掌握著我們一切的信息,能給我們安利心動的產品,提供我們需要的服務,還能讓我們覺得我們看到了想看的一切。

(圖源:executivestyle)

大數據分析出我們的三觀,平台可以按照我們的三觀偏好推送信息。

當我們毫不設防,我們的視野被控制在大數據為我們預設的軌道里,小到消費購物,大到政治宗教,我們最終淪為大數據的提線木偶。

(圖源:inc)

前不久,科幻電影銀翼殺手2049里有這樣一幕:虛擬人Joi讓K感受到了深刻而真實的愛。

但影片最後Joi的廣告卻出現了一句,讓人類害怕的話,「Everything you want to hear 說你想聽到的一切」

(圖源:thefilmmagazine)

了解你,洞悉你,甚至比你自己都清楚你。

大數據時代,我們還有何處可逃?

Source:

cnn.com/2018/03/20/poli

independent.co.uk/voice

nytimes.com/2018/03/20/

nytimes.com/2018/03/17/

bbc.com/news/uk-4348097

nytimes.com/2018/03/19/

newsroom.fb.com/news/20

buzzfeed.com/ryanmac/th

theguardian.com/news/20


推薦閱讀:

【隱私安全】免費公開課送上~
面對隱私,我們真的有必要那麼神經過敏?
Facebook作過哪些惡?
互聯網下,如何證明你不是個傻逼
大數據智能時代個人隱私誰來保護?

TAG:大數據 | Facebook | 隱私 |