Facebook「數據門」究竟是怎麼回事?

? ? ? ?

作者:方可成

從上周末開始,Facebook(又雙叒叕)成為新聞頭條。涉及5000萬用戶的「數據門」被《紐約時報》和《衛報》揭開,引發輿論嘩然。一些媒體添油加醋稱「臉書要完」,而Facebook的股價確實也已經跌去超過10%。

不過,這次事件並不是我們之前常見的「數據被黑」、「用戶資料泄漏」。它的內核更加微妙——有人會認為,Facebook其實沒什麼明顯過錯,它成為眾矢之的有點冤;也有人認為,Facebook應該承擔主要責任。從對這次事件的分析中,我們可以觸及人類邁入大數據時代之後面臨的一些核心難題。

究竟發生了什麼?是數據泄漏嗎?

率先揭露此事件的《衛報》,在上周六的報道中使用的標題是:「Revealed: 50 million Facebook profiles harvested for Cambridge Analytica in major data breach」(五千萬Facebook用戶資料在一次重大數據泄漏中被劍橋分析公司獲得)。

這裡有一個非常關鍵的詞:data breach(數據泄漏)。據《連線》雜誌報道,Facebook要求《衛報》不要在報道中使用這個說法,同時在公司自己的博客上也旗幟鮮明地表示:把這次事件說成是「數據泄漏」是完全錯誤的。

為什麼Facebook會如此抗議對這個詞的使用?因為這個詞一般指的是:網站的安全漏洞被黑客攻破,用戶的密碼、信用卡號等隱私數據被盜。

但是在這次事件中,這五千萬人的數據根本不是被攻破偷走的,而是被人大搖大擺地從大門走進去拿走的。

整個過程並不複雜,也沒什麼高科技——

2013年,劍橋大學學者、俄羅斯裔美國人Aleksandr Kogan開發了一個app。他向Facebook公司申請:通過Facebook的平台連接這則app,獲取使用這則應用的用戶的數據。他表示,獲取的數據將僅僅用做學術用途。

Aleksandr Kogan

這個app叫做「thisismydigitallife」,其實就是一個心理測試。不過,在回答測試題之前,用戶需要同意這則應用獲取他們以及他們好友的數據。

有27萬人使用了這個app,他們都同意了這個app獲取自己的數據。因為他們同時也同意了這個app抓取朋友的數據(他們的個人資料、發布的內容、點贊評論等),所以Kogan最後獲得了五千萬人的數據。

Kogan把數據交給了商業屬性的劍橋分析公司,違反了最初的學術使用承諾。Facebook了解到之後,要求Kogan和劍橋分析公司刪除數據。Kogan和劍橋公司表面上答應,但是私下並沒有刪除。

以上就是核心事實。至於這五千萬人的數據對川普勝選有沒有產生影響?現在看來應該沒有,因為川普競選團隊和劍橋分析公司都表示,並沒有在競選的時候使用這個資料庫,他們用的是共和黨傳統的選民資料庫。更何況,這批數據是2013年收集的,比較過時了。劍橋分析是一家從廣告公司起家的機構,擅長吹牛,試圖把全球各地的政治投票結果都說成自己的功勞,但是一些業內人士卻認為他們只是個笑話,是水變油的大忽悠。

Facebook有責任嗎?

周三,扎克伯格在沉寂了幾天之後終於公開發聲,承認「我們也犯下了一些錯誤」,但是他的聲明並不像是完全的道歉,而是強調公司已經做了很多事情。

他表示,其實在2014年的時候,Facebook平台就已經更改了規則,不再允許第三方應用獲取用戶好友的數據。也就是說,Facebook在2013年的時候允許第三方開發者獲取好友數據,Kogan在這個規則下獲取了幾千萬人的數據;但是一年之後,規則改了,大家就沒法再這樣做了。

後來,Facebook要求Kogan和劍橋公司刪除數據並提交證明,他們也提交了(據稱所謂的證明只是在紙上打個勾而已)。只不過,小人難防。而Facebook也沒有花費資源去確保數據真的已經被刪除。

所以,Facebook在這個事件中的具體責任主要在兩點:

一是2014年之前,對用戶數據開放得過多,導致很容易被濫用。第三方開發者可以輕易獲取大量用戶數據,其中用戶好友數據是未經這些好友本人同意的。不過Facebook在2014年的時候已經將這個漏洞堵上了。

二是沒有確保Kogan獲取的數據只用於學術,也沒有去查他到底有沒有刪除數據。

數據門背後的核心問題

事件並不複雜,也並沒有《紙牌屋》那樣的戲劇性。但是我們能從事件中看到更深的東西。

正如學者Zeynep Tufekci所言,這次事件的確不是技術意義上的數據泄漏,但它比數據泄漏更加「細思恐極」,因為它幾乎可以說是Facebook商業模式的必然後果。

這種商業模式的本質就是:獲取用戶數據,把用戶的背景、工作、收入、個性、愛好等等個人信息盡量收集完整,甚至從其他渠道(比如銀行)購買補充數據,變得「比你自己更懂你」;然後,把這些信息賣給廣告商、競選團隊等,讓它們可以更精準地投放廣告,影響用戶的想法和行為。

這種模式不是Facebook獨有。它已經成為全世界許許多多互聯網公司的基礎商業模式。你現在手機里裝的app,也許大多數都建立在這種商業模式的基礎上。所以說,用戶數據已經成為今天互聯網的基礎資源,就像石油一樣。

很難說這種商業模式有錯。但是,當數據成為石油的時候,我們就會看到很多為了爭奪石油而違反倫理界限的行為。最典型的,就是用「坑蒙拐騙」的方式誘導你交出數據。

要使用一個app?好的,請你在註冊的時候同意我們的用戶協議。這些協議一般都巨長且難懂,沒有人真的會去仔細閱讀,而且你不同意就用不了這個app,所以你只能乖乖點擊同意,並不知道協議裡面已經寫了:你的所有數據都可以被開發這個app的公司獲取、使用、共享給別人。

就算是簡潔明了地告訴你:我們會收集你的頭像、地址、狀態等信息,你點擊了同意,也不一定就是真正的「知情同意」。因為你並不知道自己的這些數據會被怎樣使用,是會被用作向我推薦淘寶商品呢,還是被用作向我發送黑希拉里的廣告?還是被一個聲稱做科研的人賣給了一個政治諮詢公司?你只有在對數據的使用有著完整的了解之後點擊同意,那才是真正的「知情同意」。

按照這樣的標準,現在我們同意交出的數據,幾乎全都是被「坑蒙拐騙」出去的。

但是問題的另一面是:如果真的要實現這樣完全的知情同意,門檻非常高。互聯網公司也會自辯說:只有讓我們多了解你,我們才能給你提供更個性化的服務,讓你享有更多的便利呀。

在知情同意和便利之間,的確存在著明顯的張力。另外,用戶數據也可以發揮重要的科研用途,所以Kogan一開始也是打著學術的旗號去找Facebook要數據的。如果禁止這些互聯網公司獲取和分享用戶數據,那麼科研事業也會遭遇很大的打擊。

正如Facebook首席安全官Alex Stamos所說,「想要讓人人享有隱私、匿名、選擇,同時又讓壞人得不到這些數據?並不存在這樣神奇的數字烏托邦。」

在這個以數據為基礎的互聯網時代,我們需要在隱私、便利、商業、公共、科研等多種價值之間作出權衡。此前,公眾對數據隱私、知情同意等問題了解得太少,天平過於傾向互聯網公司那一端,用戶幾乎毫無招架之力。現在,隨著一次次這樣的醜聞被曝光,天平正逐漸發生變化。

現在我們同意交出的數據,幾乎全都是被「坑蒙拐騙」出去的。

讓更多人了解這個問題,並行動起來

這次事件之後,美國和歐洲的不少政客已經表達了強烈的關注。互聯網企業可能將會面臨嚴格的監管。

歐洲在監管科技公司方面一直比美國更加積極和嚴格。從今年5月25日開始,歐盟數據保護條例《General Data Protection Regulation》將會生效。這項法案將給予用戶更大的權利,對互聯網公司作出更多的限制。

法案生效後,互聯網公司必須用清晰、簡潔的方式告知用戶:將會收集和使用具體哪些用戶數據,是姓名、地址,還是IP地址、點贊評論?同時,互聯網公司還必須告知用戶:為什麼要收集這些數據,這些數據會不會被用來形成你的「用戶畫像」。此外,用戶可以有權訪問互聯網公司收集的數據,有權修改不準確的數據,也有許可權制演算法的干預。

也就是說,這項法案要推動的是真正的知情同意。

在美國,針對科技公司的政策一向更為放任,短期內可能不會見到類似法案的出台。這幾天被討論最多的一項法案草案,也只是要求在互聯網平台投放的政治廣告必須披露更多的信息——誰出錢投放的,和候選人什麼關係。但是我們可以看到,大致的走向同樣是對科技公司進行更多的監督,畢竟它們擁有可以攪動整個社會的力量。

事到如今,已經連續陷入各類爭議事件的扎克伯格是否委屈?他當然可以說:我不是壞人,我知道我的產品有漏洞、可能被壞人利用,可是當我在哈佛寢室里開發這個產品的時候,壓根想不到這麼多啊!

如果Facebook依然只是一些哈佛學生的玩物,那麼大家自然不會去關注其中的各種漏洞和問題。但當Facebook已經成為千千萬萬人生活中必不可少的存在,成為主要的新聞獲取平台,成為商家和政客的必爭之地,我們只能說:能力越大,責任越大,小扎享有了巨大的商業成功和影響力,同時也就必須承擔起自己的社會責任。

萬維網之父Tim Bernes-lee在推特上發表了一系列評論,他說:「我可以想像,當扎克伯格發現自己創造的東西被人濫用、亂用的時候,他心裡有多絕望(我自己有時候也有同樣的感受)。」

同時,他以前輩的口吻對扎克伯格說:沒關係,你可以把它修好的。雖然不容易,但是只要你和政府、倡議團體、學者、用戶合作,大家是可以一起確保這個平台為人類服務的。

他還對億萬互聯網用戶說:「我可能發明了萬維網,但是你們共同造就了它今天的模樣。我們可以共同塑造一個更好的網路——用戶們可以做的是,關心自己的數據,那是你自己的東西,告訴公司和政府,你的數據很重要。」

在一片錯愕和緊張的情緒中,萬維網之父給出了樂觀的聲音。但這種樂觀並非從天而降的,它建立在更多人意識到這個問題的重要性、更多人行動起來的基礎之上。


推薦閱讀:

Facebook這一手讓Craigslist和eBay都慌了
Facebook滅頂之災 ! 20000萬億美金罰款
沖Echo Show而來?Facebook智能音箱的布局不限於此

TAG:數據 | Facebook | 怎麼 | Face | ebook |