為什麼要警惕《未來簡史》中的數據主義？

01-30

FBI WARNING！本文有部分劇透！

過去人類面臨的三大難題——控制饑荒、瘟疫、戰爭。
擺在人類面前的新三議題——獲得永生、幸福、神聖。

一、聖子降臨

達爾文提出《進化論》的150年後，生命科學研究認為，假設生物體都是演算法，那麼生命就是數據處理的過程，換言之，人是由「數據」構成的。

而研究顯示，過去幾年中人類製造的數據占整個人類歷史數據量的95%，換言之，大數據時代已經真正降臨（詳見：大數據最核心的價值是什麼？）。

通讀全書後，作為一名數據研究者，很榮幸，Harari將最後一章留給了數據——信數據得永生。他察覺到，或者說大部分人都察覺到了，大數據正在全面改造人類的思維方式及生活方式：

因為數據流動量過大，人類無法將數據轉化為信息，更不用說知識和智能。

分散式數據處理的效果比集中式數據處理更好（如市場經濟和計劃經濟）。

民主與專制，本質上即兩套不同的數據分析和信息收集的對立機制。

人類逐漸放棄直覺和經驗，選擇相信大數據的決策和分析。

以上結論很容易理解。我們都知道，人類大腦的容量是有限的。而大數據，是建立在海量「歷史行為」和「前人經驗」上，對未來的一種洞察。人類更傾向於相信大多數人的選擇，這是一種無可厚非的，符合生物本能的「自我保護機制」。比如，出行時我們通常會選擇地圖導航給出的最佳路線，網上購物時我們通常會選擇銷量最好的商品等。人類生活已經愈發離不開以大數據為基礎的AI技術。

二、新世紀宗教

作者對21世紀新的宗教——「數據主義」進行了定義。數據主義者認為，宇宙是由數據組成，任何現象或實體的價值就在於對數據處理的貢獻。有了更好的演算法和數據，人類這種生物演算法就會被自然淘汰，數據主義者信仰兩條誡命：

第一誡命：要鏈接更多的媒體，產生更多的信息。

第二誡命：要將萬物接入系統，異端也不能例外。

接著筆鋒一轉，開始對「數據主義」進行了暴風雨般的批判：

信仰數據主義意味著：放棄隱私、自主性和個別性。

數據主義對人類產生了威脅：不在乎我們的主觀需求。

數據主義已經從中立的科學理論演變成判別是非的宗教。

數據主義者認為一切皆數據，全人類是單一的數據處理系統。

龐大的演算法（如Google搜索引擎），沒人能夠理解其全部的要義。

機器學習和人工神經網路等「種子演算法」會找出人類無法預見的東西。

批判數據主義，將成為21世紀最大的挑戰及最迫切的政治和經濟問題。

咋一看，某些言論有點危言聳聽。反思之後發現，現實之中，確實存在兩派人馬：

技術萬能派——喜歡研究各種新技術和工具，信仰「萬物皆數」，技術發展決定業務導向。在他們眼中，「要麼數字化，要麼死亡」，一切都可以用數字來解釋。

業務萬能派——喜歡研究各種話術和營銷學，信仰「情感交流」，技術僅僅是為業務服務的。在他們眼中，DA&&DM只是一種工具，屬於所用的眾多工具的一種。

相信作者批判的類型應該是前者，個人信仰不同，這裡不談對錯，只談利弊。

大數據，「大」字確實重要，但是遠沒有很多人想像的那麼重要。打個不太恰當的比方，海洋里的水非常多，但是我們無法直接飲用，需要提純和凈化。數據亦是如此，高質量的數據非常寶貴，而清洗和篩選的過程決定了數據質量的好壞，但過濾後留下的不一定是「金沙」，也可能是泥沙，數據唯有結合實際業務指標，才能真正理解、判斷其真正的價值。

大數據，「數」不會說謊，Numbers dont lie，使用數據的人才會說謊。基於不同的立場，代表個各自的利益，每個人使用數據表達自己觀點的人，都會在不自覺中，收集對自己觀點有正面作用的數據，而排斥對自己觀點有負面作用的數據，數據清洗和篩選有時候反而成了消除異見的武器。（詳見：「數據會說謊」的真實例子有哪些？）

綜上：

直覺與數據，雙劍合璧，方能獨步武林。

三、潛在的危險

作為一名數據人，經常會遇見很多有意思的事。舉個栗子，以前在做推薦系統的協同過濾研究時，最常收到的用戶批評類似這樣：「剛買了一個電飯鍋，又給我推薦一個電飯鍋，誰家裡要兩個電飯鍋？」

咋一看連續推薦兩個屬於同一類的物品A確實非常反人類，其實推薦系統在設計之初，已經考慮了這樣的問題，所以才會加入多樣性、驚喜度等多種評價指標。當然，偶爾出現重複推薦也是合情理的，萬一有人真的想買兩個送人呢(●—●)

記得2014年在TED上，有位研究者提出了一個很有趣的觀點，大意是：由於推薦系統等技術的發展，人類在網上購物時更容易獲得自己的喜歡的東西，在Facebook上更容易遇見和自己意見（政見）相同的人，更容易組成自己的小圈子。你不喜歡什麼，系統就不讓你看到什麼。

舉幾個栗子，比如我不喜歡看數學書，喜歡玩電子遊戲，系統就給我推薦更多的魔獸世界、爐石傳說；我不喜歡希拉里，更中意川普，系統就屏蔽掉政見相異者，讓我認識更多川粉；我不喜歡某個人的言論，TA關注的人和關注TA的人我都不想看見，AI說：如你所願我的主人，我已經將所有你不喜歡的人屏蔽掉了。

咋一看，一切非常完美，生活也多了幾分和諧，少了很多麻煩。但這樣會出現的一個嚴重問題：你會活在自己的世界裡。因為與你意見、愛好不同的人都被你屏蔽掉了。你會以為自己才是「多數派」，看不見更大的世界，一葉障目不見泰山；看不見更大的危險，因為眾人的觀點都和你相似。活在這兒，最好的結果是：成為井底之娃，活在自己的世界裡很快樂。

更嚴重的後果是，拿小明來說，如果小明是一名抑鬱症（depression）or孤獨症（自閉症）患者，這樣相對的封閉環境只會讓小明的病情更加嚴重；如果小明是一名宗教極端主義者（Extremism），AI給小明推薦的都是類似的人，這樣會讓小明覺得自己的行為沒什麼異常，如果越來越多的人都這樣考慮，那麼形成Islamic State這樣的組織也就不足為奇了。

1967年，哈佛大學的心理學教授Stanley Milgram提出的六度分隔（Six Degrees of Separation）理論——你和任何一個陌生人之間所間隔的人不會超過六個，也就是說，最多通過六個人你就能夠認識任何一個陌生人。在未來的某一天，這個數字將會縮小到5、4甚至1，當間隔=1時，相當於你只要點擊滑鼠，你就可以於世界上任何一個人產生鏈接。

What A Terrible World, What A Beautiful World.

這是一個美好的世界，溝通交流如此便捷；這是一個可怕的世界，私密空間不復存在。

這是一個美好的世界，理解包容如此容易；這是一個可怕的世界，意見相左視而不見。

這是一個美好的世界，你的敵人都將屏蔽；這是一個可怕的世界，你的敵人都將隱藏。

四、敬畏之心

有二事恆然於心，敬畏日省日甚：外乎者如璀璨星穹，內在者猶道德律令。

高盛集團Quant、物理學家伊曼Emanuel Derman 在《Models.Behaving.Badly》一書中分析了在金融領域採用數學模型研究數據的危險性：在物理學研究領域，我們面對的是上帝，上帝制定了一條條規則之後，一般不會朝令夕改。但是在金融領域，我們面對的是上帝創造的人，他們估計金融資產價值的依據就是自己的直覺。

同樣，作為21世紀的「鍊金術師」，研究上帝創造的人性時，我們也應「心懷敬畏」，腳踩數據的大地，仰望直覺的星空；忠於崇高的理想，探索複雜的現實。

曾於書中看過這樣一段話：人人生來自由，每個人都有自由選擇的權力，但這也許只是一種假象。人都為了生活，每天都在做自己必須做的事情。工作、掙錢、結婚、生育，一直幻想了某一天能夠財務自由，拿起背包去環遊世界，但第二天仍然只能早早起床，按時上班。

如果人類未來的道路只有一條，希望這條路不要被人類所預見。

心存敬畏之心, 方能行有所止。

以上，與所有數據人共勉。

[1].《Data-ism: The Revolution Transforming Decision Making, Consumer Behavior, and Almost Everything Else》.Steve Lohr.2015

[2].《Homo Deus：A Brief History of Tomorrow》.Yuval Noah Harari.2017

Find Me wx: Dataology