標籤:

大數據時代:網路數據與科學的時代

這兩個詞最早出現是在上世紀90年代。按照當時的解釋,大科學時代主要是指單打獨鬥的時代結束了,要搞集團軍式的科研。也有一種說法是,要把學科的範圍向外擴張,擴到所有有關的學科論題範圍內。也就是說要搞無所不包的科學,一個是從組織形式上定義,一個是從研究範圍上定義。

其現代版本就是:科研團隊;跨學科。

大數據時代最初是指:科研人員面臨海量數據的採集、處理、解釋工作,對數據作簡單直觀分析的時代過去了,要從噪音遠大於有效信號的情況下提純出有效信號,也就是譜分析的時代到來了。

其現代版本就是:海量原始數據採集、處理;數據解釋及擬合(與理論對比)。

在經歷工程化應用的成敗後,有以下幾個要點是可以肯定下來的:1、海量原始數據採集、處理的價值和有效性取決於最初的理論考慮;2、數據解釋及擬合結果的科學性還是取決於對理論的把握程度。3、理論水平的地位被迫推上第一位。因而,大數據時代拼搏的是對學科理論的深層次把握能力。

有的人誤認為所謂的大數據時代就是從數據出發,用五花八門的演算法得到「成果數據」,爾後做出「合理的解釋」,從而,構造出一系列的「規律」。這種思想流傳深遠。反對者斥之為數字遊戲;支持者熱衷於對其「客觀性」,「實驗證明」的論證。

在哲學上的基礎是:任何一種規律性的作用在系統科學看來無非就是確定其響應函數而已,只要採集到了輸入、輸出數據,就可以用數據處理方法得到所希望得到的響應函數,從而,得到系統的「規律」。

這種科學研究觀點大大的降低了對學科理論水平的要求,只要能玩轉計算方法,就可以在有實際數據時,輕而易舉的發現各式各樣的「規律」。

檢索一下30多年來的學位論文、期刊論文,可以非常明確的看到這種觀點是如何由弱到強,直到成為主流的全過程。

但是,很遺撼,這樣得到的「規律」並不能成為科學規律,就連經驗規律也未必夠得上。

在哲學上,這是把實測數據與實驗數據概念混淆的必然結果。

大科學概念在為構造科研團隊和跨學科研究建立理論基礎的同時,也衝擊了科學真理的有限性概念。把某個學科的規律的有效性外推到過去沒有實驗證明的另一個學科,并力圖證明在該學科「也滿足此規律」是非常危險的「科學研究」。

但是,另一方面,也是最容易取得「創新性成果」的方法。

因此,「大數據時代+大科學時代」這兩個概念的合成必定大大的促進「科學發現」、產出大量的「最新成果」。

但是,在哲學上有兩個致命錯誤:1、主觀性的擴大有限論域內的相對真理到無限論域內的絕對真理;2、把實測數據與實驗數據概念混淆,拋棄本質而追求表象。

但是,「大數據時代+大科學時代」這兩個概念的合成必定在我國科學界流行,天下大勢如此。

Bingdata優網助幫匯聚多平台採集的海量數據,通過大數據技術的分析及預測能力為企業提供智能化的數據分析、運營優化、投放決策、精準營銷、競品分析等整合營銷服務。

北京優網助幫信息技術有限公司(簡稱優網助幫)是以大數據為基礎,並智能應用於整合營銷的大數據公司,隸屬於亨通集團。Bingdata是其旗下品牌。優網助幫團隊主要來自阿里、騰訊、百度、金山、搜狐及移動、電信、聯通、華為、愛立信等著名企業的技術大咖,兼有互聯網與通信運營商兩種基因,為大數據的演算法分析提供強大的技術支撐。


推薦閱讀:

大數據時代的數據價值與利用
R語言 從入門到精通之一R語言初識
大數據時代必須破解的重大現實課題

TAG:大數據時代 |