如何看待《大數據時代》中提到的「不是因果關係,而是相關關係」,對科研有什麼啟發?

這是《大數據時代》中三個觀點中最受爭議的一個觀點,提出這個問題有幾個目的:

1,想收集一些這方面更有力的證據和實例;

2,這種觀點會對科研造成什麼樣的影響(悲觀的說)?或正面一些,會對科研有哪些啟發?


先回答第一個問題:

書中的大量例子都是可以查詢的,同時我也認為是可靠而有意義的,我也比較認同。目前相關關係使用離個人最密切的網商,同時包括我們目前的大量網頁設計或手機app設計也是基於大量數據研究得出的最受歡迎理論,以目前書中的例證自尋拓展,我覺得隨處可見相關關係研究在目前日常生活中的滲透。

第二個問題

抱歉我腹黑的笑了。相關關係應該說是目前科學發展的基礎,雖然有大量的科學理論是以邏輯推導的來的,但還是有相當一部分是先發現相關關係,再研究因果關係,通過科學的研究方式,最終提煉出目前我們所認知的理論體系。在當前時代主要是因為獲取大量數據和處理大數據的能力使我們可以更快的獲得相關關係,特別熟對大數據的炒作導致這種最基礎的研究方式收到了相當的追捧,但本質上這種研究方式是我們一直在使用的,只是更多的使用的是樣本統計的說法。

但是鑒於時代的發展速度和社會需求,深入的研究相關關係有時候意義甚於研究因果關係,甚至在部分使用過程中,因果關係已經沒有意義。

之於在科研上來說,相關關係是可以讓我們更快的發現指向因果關係的風向標,同時更快速的排除不必要的行為,以加快研究進度(想想愛迪生其實也是用的研究相關關係的方法再次發明電燈泡),特別在研究複雜系統時,使用大數據進行研究的方法應該是效率很高的。

綜上,我個人認為相關關係的研究是一種提高研究效率的方法,在一定程度上對研究有量變引起質變的作用。副作用我認為是在於炒作和錯誤的使用這個方法,類比於菜刀殺人是不應該研究菜刀的發明是否錯誤的。


我覺得這是《大數據時代》對相關關係及因果關係概念上的混淆

——————————————————————————————

例如:沃爾瑪將蛋撻與颶風用品放在一起銷售的案列

如果僅是相關關係的話,那麼還存在如下可能

賣蛋撻導致颶風

如果這樣的話,來颶風后多擺蛋撻,就沒有任何用處了

大數據時代,其實就認定了颶風是蛋撻銷量增高的原因

這就是在進行因果分析

但是:這本書偏偏不這樣說,他把因果關係曲解成必須從心理學啦、天氣對人的影響啦之類的角度出發才算。


只發現相關,無法解決問題的全部,只有在相關的基礎上找到因果才能真正講好故事


推薦閱讀:

在實體經濟一片下滑的大環境中,哪些行業還可以?
基於大數據的成功應用有哪些 ?
美國致力於大數據分析的公司有哪幾個?
做大數據開發好還是大數據分析比較好一些?
大數據聽著很牛,實際上也很牛嗎?

TAG:相關性分析 | 科研課題 | 因果關係 | 大數據分析 | 大數據時代書籍 |