大數據中的時代圖景

《大數據:正在到來的數據革命》

作者:塗子沛

出版社:廣西師範大學出版社

大數據浪潮,洶湧來襲。可以說,現今的我們已經進入了大數據時代。當我們瀏覽電影、音樂網站時,系統會根據我們的觀影記錄推薦我們或許感興趣的影片、歌曲;當我們網購時,系統會自動向我們推薦此前購買過的同類商品;甚至我們的分享經濟、共享單車等都離不開大數據……總之,大數據的價值體現在當前人們的經濟和社會生活中是全面的。

美國有句諺語叫「除了上帝,任何人都必須用數據來說話」。不管我們是否想到或注意到,我們已經陷入一張數據採集的羅網。這張網的覆蓋面之廣不但我們絕對難以想像,而且通過分析我們個人數據所得出的報告可能比我們還要了解我們自己。

毫無疑問,大數據作為新一輪信息戰的主角,將創造無限商機,既便利又關涉、危及著每個人的生活。學者塗子沛的《大數據:正在到來的數據革命》正是以信息化為背景,向人們講述尊嚴的生活需要「大數據」。雖然作者主要寫的是美國的「大數據」歷程,但作者的落腳點在於「叫醒中國」。

大數據創造時代的根本價值

何謂大數據?簡單理解就是超大量的數據。大數據指一般的軟體工具難以捕捉、管理和分析的大容量數據,一般以「太位元組」為單位。「大數據」之「大」,並不僅僅在於「容量之大」,更大的意義在於:通過對海量數據的交換、整合和分析,發現新的知識,創造新的價值,帶來「大知識」「大科技」「大利潤」和「大發展」。

大數據是基礎性資源,也是重要生產力。大數據是這一時代的特徵,是新一輪產業革命的重要引擎。世界正在經歷著一個深刻的、前所未有的巨變。新一輪產業革命,本質上是智能革命(包括人工智慧、基因技術、大數據、區塊鏈,等等),而智能革命的基礎是信息化,大數據是根本。

沒有大數據對客觀事物全面、快速、真實、準確的信息反饋,任何智能設備都不可能實現真正的智能。歸根到底,新一輪產業革命是「大數據的革命」。基於信息技術對數據價值的挖掘,「智能製造」進一步向系統化、集成化縱深發展,商業機構對個人和市場定製個性化的服務和產品成為商業競爭的基本模式。當然,「在變動的時代,能終身學習的人,會比其他人更具有應變的韌性」。所以,在未來能夠生存下來的人,並不是最強或最具才智的人,而是最能適應變化的人。

大數據開放的商機在哪裡?在大數據時代,人的行為都以數據形式存在。這裡面就有很多商機。通過研究消費者習慣,可以找到很多市場商機。就算在企業運營中,優化才能提高效率,減少成本,優化就要基於數據。產品也離不開數據,產品質量控制就是以數據為支持的。大數據最根本的,就是促進經濟的發展,知識時代的特點就是信息和數據的整合產生新的價值。

當然,塗子沛在《大數據》中主要描繪了美國走過的開放創新曆程。全書講述了美國半個多世紀信息開放、技術創新的歷史——奧巴馬建設「前所未有的開放政府」的雄心、公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、數據開放運動的全球興起以及雲計算、社交媒體與下一代互聯網的未來圖景等。

這一番細解揭示了大數據在美國社會的基礎性價值,展現了數據創新給政府、社會、經濟帶來的種種挑戰和變革。美國社會的發展,經濟的進步以及各種福利的保障,都和對數據的創造性應用密切相關。而這對已經步入信息時代的中國尤其有借鑒意義。

塗子沛

大數據中的「文化鄉愁」

美國的數據化歷程是作者寫作的主題,但作者又處處反觀中國當下的現實,表達著作者的「中國鄉愁」。作者「按捺不住,要絮叨幾句我們中國在這個大時代當中所處的位置」。因為今天的中國,「是一個人口大國、互聯網大國、手機大國」,但「還不是一個數據大國」。

這從中國人的文化習慣中就可以看出來。中國近現代思想家胡適對中國人「凡事差不多、凡事只講大致如此」的習慣和作風深感憂慮。1919年,他寫下著名的《差不多先生傳》,活靈活現地白描了中國人取道中庸、不肯認真、拒絕精準的庸碌形象。

歷史學家黃仁宇對中國人缺乏「數據精神」的根源作了剖析,他認為:在中國傳統的學問——理學或道學當中,一直都分不清倫理之「理」與物理之「理」的區別。這兩個「理」混沌不分的結果,是中國人傾向於粗略的主觀定性、排斥精確的客觀定量,從而養成了重形象、重概括、輕邏輯、輕數據的文化習慣。

這種文化習慣,使中國人長期沉浸在含蓄、模糊的審美意識當中,凡事只能在美術化的角度來印證,滿足於基於相似的「模糊聯想」,最終將表象上的相似,當做本質上的相同。

對此,作者將之總結為「國民性」的一部分:「歸根到底,中國人對數據的漠視,緣於一種文化上的缺欠:隨意、盲目、不求甚解、理性不足。」

這也許就是史學家、匹茲堡大學歷史系榮譽講座教授許倬雲對塗子沛所作的工作高度評價的緣故。許倬雲說:「我們要對塗子沛先生致敬與致謝,因為他為華文世界提出一個重要的話題。」

作者發現,和美國相比,中國擁有數據量的絕對值較小。客觀上,一個數據帝國的建成,以美國為例主要有三個來源:一是業務管理的數據;二是民意社情的數據;三是物理環境的數據。當然,這三種數據的積累,並不是一蹴而就的,而是經過長期積累才能顯示出效果。

中國在這些方面起步很晚,三種數據的採集都是從進入21世紀開始的。因此,從歷史發展的角度來看,中國擁有的數據量較小。但作者在認真考察了諸多因素之後發現,「中國缺乏的不是可供收集的數據,也不是收集數據的手段,而是收集數據的意識」。

這也是作者要批判的「國民性」之一,「中國人數據意識的淡薄,由來已久,甚至可以稱之為國民性的一部分」。這在書中也完整地構成了作者大數據里的「文化鄉愁」,也是作者的憂慮:中國人確實缺乏「用數據來說話」的素養。所以,大數據的問題,急需引起政府、企業和全社會的重視。

微信號:花家地壹號


推薦閱讀:

今日數據行業日報(2016.7.6)
經典模型分析
今日數據行業日報(2016.09.30)--199IT祝大家國慶快樂!
綠卡審理時間數據被批不實 美移民局更新查詢系統
從0開始, Data Scientist 之路 Day 3

TAG:大數據 | 數據 | 時代 |