為什麼要警惕《未來簡史》中的數據主義?

FBI WARNING!本文有部分劇透!

過去人類面臨的三大難題——控制饑荒、瘟疫、戰爭。

擺在人類面前的新三議題——獲得永生、幸福、神聖。

一、聖子降臨

達爾文提出《進化論》的150年後,生命科學研究認為,假設生物體都是演算法,那麼生命就是數據處理的過程,換言之,人是由「數據」構成的。

而研究顯示,過去幾年中人類製造的數據占整個人類歷史數據量的95%,換言之,大數據時代已經真正降臨(詳見:大數據最核心的價值是什麼?)。

通讀全書後,作為一名數據研究者,很榮幸,Harari將最後一章留給了數據——信數據得永生。他察覺到,或者說大部分人都察覺到了,大數據正在全面改造人類的思維方式及生活方式

  1. 因為數據流動量過大,人類無法將數據轉化為信息,更不用說知識和智能。
  2. 分散式數據處理的效果比集中式數據處理更好(如市場經濟和計劃經濟)。
  3. 民主與專制,本質上即兩套不同的數據分析和信息收集的對立機制。
  4. 人類逐漸放棄直覺和經驗,選擇相信大數據的決策和分析 。

以上結論很容易理解。我們都知道,人類大腦的容量是有限的。而大數據,是建立在海量「歷史行為」和「前人經驗」上,對未來的一種洞察。人類更傾向於相信大多數人的選擇,這是一種無可厚非的,符合生物本能的「自我保護機制」。比如,出行時我們通常會選擇地圖導航給出的最佳路線,網上購物時我們通常會選擇銷量最好的商品等。人類生活已經愈發離不開以大數據為基礎的AI技術。

二、新世紀宗教

作者對21世紀新的宗教——「數據主義」進行了定義。數據主義者認為,宇宙是由數據組成,任何現象或實體的價值就在於對數據處理的貢獻。有了更好的演算法和數據,人類這種生物演算法就會被自然淘汰,數據主義者信仰兩條誡命:

  1. 第一誡命:要鏈接更多的媒體,產生更多的信息。
  2. 第二誡命:要將萬物接入系統,異端也不能例外。

接著筆鋒一轉,開始對「數據主義」進行了暴風雨般的批判:

  1. 信仰數據主義意味著:放棄隱私、自主性和個別性。

  2. 數據主義對人類產生了威脅:不在乎我們的主觀需求。
  3. 數據主義已經從中立的科學理論演變成判別是非的宗教。
  4. 數據主義者認為一切皆數據,全人類是單一的數據處理系統。
  5. 龐大的演算法(如Google搜索引擎),沒人能夠理解其全部的要義。
  6. 機器學習和人工神經網路等「種子演算法」會找出人類無法預見的東西。
  7. 批判數據主義,將成為21世紀最大的挑戰及最迫切的政治和經濟問題。

咋一看,某些言論有點危言聳聽。反思之後發現,現實之中,確實存在兩派人馬:

  • 技術萬能派——喜歡研究各種新技術和工具,信仰「萬物皆數」,技術發展決定業務導向。在他們眼中,「要麼數字化,要麼死亡」,一切都可以用數字來解釋。
  • 業務萬能派——喜歡研究各種話術和營銷學,信仰「情感交流」,技術僅僅是為業務服務的。在他們眼中,DA&&DM只是一種工具,屬於所用的眾多工具的一種。

相信作者批判的類型應該是前者,個人信仰不同,這裡不談對錯,只談利弊。

大數據,「大」字確實重要,但是遠沒有很多人想像的那麼重要。打個不太恰當的比方,海洋里的水非常多,但是我們無法直接飲用,需要提純和凈化。數據亦是如此,高質量的數據非常寶貴,而清洗和篩選的過程決定了數據質量的好壞,但過濾後留下的不一定是「金沙」,也可能是泥沙,數據唯有結合實際業務指標,才能真正理解、判斷其真正的價值

大數據,「數」不會說謊,Numbers dont lie,使用數據的人才會說謊。基於不同的立場,代表個各自的利益,每個人使用數據表達自己觀點的人,都會在不自覺中,收集對自己觀點有正面作用的數據,而排斥對自己觀點有負面作用的數據,數據清洗和篩選有時候反而成了消除異見的武器。(詳見:「數據會說謊」的真實例子有哪些?)

綜上:

直覺與數據,雙劍合璧,方能獨步武林。

三、潛在的危險

作為一名數據人,經常會遇見很多有意思的事。舉個栗子,以前在做推薦系統的協同過濾研究時,最常收到的用戶批評類似這樣:「剛買了一個電飯鍋,又給我推薦一個電飯鍋,誰家裡要兩個電飯鍋?」

咋一看連續推薦兩個屬於同一類的物品A確實非常反人類,其實推薦系統在設計之初,已經考慮了這樣的問題,所以才會加入多樣性、驚喜度等多種評價指標。當然,偶爾出現重複推薦也是合情理的,萬一有人真的想買兩個送人呢(●—●)

記得2014年在TED上,有位研究者提出了一個很有趣的觀點,大意是:由於推薦系統等技術的發展,人類在網上購物時更容易獲得自己的喜歡的東西,在Facebook上更容易遇見和自己意見(政見)相同的人,更容易組成自己的小圈子。你不喜歡什麼,系統就不讓你看到什麼。

舉幾個栗子,比如我不喜歡看數學書,喜歡玩電子遊戲,系統就給我推薦更多的魔獸世界、爐石傳說;我不喜歡希拉里,更中意川普,系統就屏蔽掉政見相異者,讓我認識更多川粉;我不喜歡某個人的言論,TA關注的人和關注TA的人我都不想看見,AI說:如你所願我的主人,我已經將所有你不喜歡的人屏蔽掉了。

咋一看,一切非常完美,生活也多了幾分和諧,少了很多麻煩。但這樣會出現的一個嚴重問題:你會活在自己的世界裡。因為與你意見、愛好不同的人都被你屏蔽掉了。你會以為自己才是「多數派」,看不見更大的世界,一葉障目不見泰山;看不見更大的危險,因為眾人的觀點都和你相似。活在這兒,最好的結果是:成為井底之娃,活在自己的世界裡很快樂。

更嚴重的後果是,拿小明來說,如果小明是一名抑鬱症(depression)or孤獨症(自閉症)患者,這樣相對的封閉環境只會讓小明的病情更加嚴重;如果小明是一名宗教極端主義者(Extremism),AI給小明推薦的都是類似的人,這樣會讓小明覺得自己的行為沒什麼異常,如果越來越多的人都這樣考慮,那麼形成Islamic State這樣的組織也就不足為奇了。

1967年,哈佛大學的心理學教授Stanley Milgram提出的六度分隔(Six Degrees of Separation)理論——你和任何一個陌生人之間所間隔的人不會超過六個,也就是說,最多通過六個人你就能夠認識任何一個陌生人。在未來的某一天,這個數字將會縮小到5、4甚至1,當間隔=1時,相當於你只要點擊滑鼠,你就可以於世界上任何一個人產生鏈接。

What A Terrible World, What A Beautiful World.

這是一個美好的世界,溝通交流如此便捷;這是一個可怕的世界,私密空間不復存在。

這是一個美好的世界,理解包容如此容易;這是一個可怕的世界,意見相左視而不見。

這是一個美好的世界,你的敵人都將屏蔽;這是一個可怕的世界,你的敵人都將隱藏。

四、敬畏之心

有二事恆然於心,敬畏日省日甚:外乎者如璀璨星穹,內在者猶道德律令。

高盛集團Quant、物理學家伊曼Emanuel Derman 在《Models.Behaving.Badly》一書中分析了在金融領域採用數學模型研究數據的危險性:在物理學研究領域,我們面對的是上帝,上帝制定了一條條規則之後,一般不會朝令夕改。但是在金融領域,我們面對的是上帝創造的人,他們估計金融資產價值的依據就是自己的直覺。

同樣,作為21世紀的「鍊金術師」,研究上帝創造的人性時,我們也應「心懷敬畏」,腳踩數據的大地,仰望直覺的星空;忠於崇高的理想,探索複雜的現實。

曾於書中看過這樣一段話:人人生來自由,每個人都有自由選擇的權力,但這也許只是一種假象。人都為了生活,每天都在做自己必須做的事情。工作、掙錢、結婚、生育,一直幻想了某一天能夠財務自由,拿起背包去環遊世界,但第二天仍然只能早早起床,按時上班。

如果人類未來的道路只有一條,希望這條路不要被人類所預見。

心存敬畏之心, 方能行有所止。

以上,與所有數據人共勉。

[1].《Data-ism: The Revolution Transforming Decision Making, Consumer Behavior, and Almost Everything Else》.Steve Lohr.2015

[2].《Homo Deus:A Brief History of Tomorrow》.Yuval Noah Harari.2017

Find Me wx: Dataology

推薦閱讀:

融資一億首提「能力服務」,海雲數據欲打造AI新格局
有沒有因為沒有使用大數據而失敗的公司?
從線上數據看2017年上海車展
大數據真能預測流感疾病爆發嗎
大數據學習計劃

TAG:大数据 | 未来简史书籍 | 书籍推荐 |