和車品覺聊數據的本質
功夫
和車老師的聊天是從李小龍的功夫開始的。前段時間我看完了金庸的《笑傲江湖》,算是對獨孤九劍這門武林絕學的要義有了基本的認識,並且又在幾天前看了一個李小龍 24 歲剛出道的一個試鏡視頻,發現他的截拳道和獨孤九劍有一定的相似之處,都是在尋找別人出招的破綻,然後進行攻擊。我就在想金庸當年寫《笑傲江湖》的時候,是不是也借鑒了李小龍的思想呢?目前我還不得而知。而車老師的新書《數據的本質》以及上一本《決戰大數據》,都提到了李小龍對他個人學習和思考的影響,他是李小龍的粉絲。
特別是在《決戰大數據》一書中,專門有一篇文章,講從李小龍的格鬥中學到的做數據的思考。在習武或者做數據分析時,我們首先會思考有沒有殺手鐧,一招制服對方,或者讓業務出現大幅增長。可實際沒有這樣的殺手鐧,即使開始有,到後面被更多的人掌握了,也不是殺手鐧了。在兩個人打鬥中,如果直接上去就出重招,可能表現出破綻,被對方所利用。反而是不斷的互相試招,就像做數據分析,我們在不能打開局面,分不清哪種方案更好時,乾脆就做一下 AB Test,拿出點新的數據再說,這就是破局。之後,不斷的關注每一點變化,然後尋找可能的爆破點。車老師因為年輕時自己學過擊劍,並且拿過金牌,所以對功夫的認識比較深刻。而這種認識又會運用到工作和生活之中,這境界就很不一樣了。
拜師、學習和思考
之前看《決戰大數據》時有一種感受,就是他站的比較高,寫的比較有思想性,但需要有一定的基礎,才可能看得懂。而在我拿到新書之前,同樣問了他一個問題,新書是什麼定位,他告訴我說是數據戰略層面的,適合管理者來閱讀。當我讀完新書後,我又有了新的疑問,我感覺這兩本的區分度並沒有那麼高,其中有三分之一的內容應該說的重疊的。車老師告訴了我答案:《決戰大數據》可以說是他 2014 年之前對數據的認識,而《數據的本質》是他這幾年對數據的認識,前一本其實在運用上,偏向於報表層面,而後一本提到了數字經濟引擎。當我提出在我看來數字經濟引擎是我看到的差異性時,他感到很開心。在我的觀念里,是把數字經濟引擎這部分看做產品智能,就是將數據給機器用,讓某個功能因為有了數據的支撐,變得更加強大,就像增加了一台數據發動機。
在新書之中,有四分之一的篇幅講述了車老師拜師、學習、思考的心得。向馬雲學習,向曾鳴學習,向李小龍學習。初看起來,這些內容可能和數據沒有太大的關係。但說來車老師的數據思想,正是他的這些思想在數據領域的投射,所以講述這些源頭就很有必要了。而這部分的內容,卻是書中最有耐讀性的一部分,這就像許多人喜歡德魯克的管理思想,而最喜歡的卻是他寫的一本非管理書籍《旁觀者》。學習高手如何學習、思考,是更高層次的學習,即學習如何學習。
數據的本質
最後,我向車老師提出了一個疑問。雖然新書叫《數據的本質》,可書中卻並沒有明確指名數據的本質是什麼。車老師給我的答案是希望讀者讀完書後,慢慢去領悟。我想車老師是學佛之人,更加看中悟性。我說這樣寫的話,可能會導致讀者讀起來比較費力,他告訴說更希望這是一本耐讀的書。我說在《決戰大數據》一書中,恰恰回答了大數據的本質是「還原用戶的真實需求」,並且把我對大數據本質的理解和他做了一個探討,可以說是相通的。我把這塊的理解寫出來,自我感覺算是高水平的切磋了。
數據(Data)是一類信息(Information)。那什麼是信息?香農給它下了個定義,就是一種消除不確定性的東西。比如我讓你猜測我握著的手心裡是否有一枚硬幣。如果不給你額外的信息,你可能隨便猜測一個答案。但我只要給你 1 比特(Bit)的信息,即 0 或 1,你就掌握了答案,也就是消除了不確定性。再比如我讓你預測某天是否是晴天,當我告訴你前一天的天氣情況,以及當前氣壓、風速、溫度等信息,你的判斷就不一樣了,這就是通過掌握更多的信息來消除更多的不確定性。既然數據是一類信息,那麼本質來說,它就是消除不確定的東西。那麼大數據加了大又有什麼不同呢?我一般用「大」、「全」、「細」、「時」來表示它。大數據更加宏觀,也可能實際物理量上大。不只是部分抽樣數據,而是全量的數據。維度更加的豐富,時效性也更高。這樣帶來的綜合結果就像形成了事情發生時的一個快照。有了這個快照,你就可以從各種角度來分析它。我是從物理屬性上來描述了大數據,而車老師把它看做還原真實的用戶需求,是從業務的角度來描述它。有了這一切,你就擁有了上帝之眼,可以做出更加有效的判斷。
和車老師溝通的次數不多,但是探討的問題質量卻很高。希望這篇文章,能夠提升你對數據的認識,也算是對《數據的本質》的一個導讀。
推薦閱讀:
※Hadoop生態圈:19個讓大象飛起來的工具!
※數據研究番外篇:召喚師峽谷野生生態調查
※《R語言實戰》圖形初階實踐筆記
※2018 年基因檢測行業有哪些機會?
TAG:大数据 |