如何看待「數據科學是偽科學」這句話?
身邊有人指出數據科學中「研究者大多關注相關程度而非內在因果」的這一特點較為突出,因此將它劃入「偽科學」的行列。
到底應如何界定數據科學的本質?題主不帶有黑數據科學的想法 只是那天朋友提起導致自己很困惑所以提了上面的問題增加一個小問題 什麼是絕對的因果關係?為什麼很難提煉?望解惑
謝邀。如果數據科學是偽科學,那經濟學、統計學是什麼?
有個概念叫「軟科學」,即自然科學與社會科學相互結合的交叉科學。數據科學一定程度也可以歸為此類。
恰恰相反,糾纏因果本質的不是科學。搞得好的是哲學,搞得不好的就是玄學。如果數據科學不知道本質反而能給公司省上億美元的電費,能夠贏圍棋世界冠軍,能夠每天交易穩賺不賠,我感覺不知道本質也能夠活。
近代科學起源於西方的兩個傳統,一個被稱為畢達哥拉斯主義,一個是機械論。畢達哥拉斯主義關注數字本身,對數字之後的物理聯繫並無興趣;而機械論關心事物之間的因果關係,並不關心對現象的精確數學描述。近代科學的興起可以看成是這兩種傳統相互結合的成果。
當然,這個觀點並非我所發明,而是源自於市面上失傳已久,但相當有價值的一套叫做《劍橋科技史》的叢書。從書裡面有作者認為前牛頓時代的兩個科技巨人,開普勒更加偏向於畢達哥拉斯主義,而伽俐略更加偏向於機械論傳統。牛頓則是兩種傳統的集大成者。
有時同時認知到事物之間的數據聯繫和因果關係是比較困難的,能夠先認識到其中一個側面也是巨大進步。很慚愧,有時候就是只能做這一點微小的工作。說這句話的人沒有分清開放混沌系統與理想數學模型的差異。
死理性派真的有病。中國傳統思維就是相關性,這是東方木的特點,生長,關聯,隱喻,經驗。西方金來克伐,東方思維基本上是受到了全盤否定,如今金性按辯證法規律轉向了木性,想想是親兒子應該能好點吧,結果金伐木的現象還是出現了。
虎毒不食子。
強答一記。其實我也不懂,說點自己的理解吧。題主的困惑好像主要集中在「相關關係」和「因果關係」上,好像觀點是「大數據得不出因果關係所以可能是偽科學」的樣子。所以呢,我要講個故事www
有個顧客給某汽車公司寫信,反映自己每次買完香草口味冰淇淋出來,車子就不能發動;但買其他口味冰淇淋出來車子可以發動。於是不信邪的工程師去考察,發現原因是香草口味冰淇淋的貨架較近,顧客買東西所用時間較短,車子的引擎來不及散熱,就發動不了;買其他口味冰淇淋的時間較長,引擎來得及散熱,就能發動了。(沒找到原文,大意是這樣)
……所以都是你們這些愛吃香草口味冰淇淋的人的鍋!你們不愛吃超市會把它擺的那麼近嗎!車子會不能發動嗎![doge]
相關關係大致就像「買香草口味冰淇淋」與「車子不能發動」這種感覺。
因果關係大概類似「引擎散熱時間較短」與「車子不能發動」這樣的關係。
數據科學(最近流行的大數據)的特長就是能看到一些事物之間的聯繫(有相關性),然而我們從數據並不能知道這些聯繫為什麼會產生(是否具有因果關係)。一般這會會加一句有待後續研究[手動白眼]
所以數據科學到底是不是為科學呢,題主自己判斷吧~
。
。
。
。
。
反正我也都是瞎瘠薄說的www
「偽科學」真的是抬高了數學,數學連自然科學都不是!
數學是依存於公理體系的學科,我也很想展開來說但我真不會!!
粗鄙的理解就是數學是學習研究科學的工具,所以數學連科學都不是何必「偽」科學呢?再粗鄙一些就是科學是可證偽的但數學天然不可證偽。
對於那些硬要說數學是形式科學的人我只想說,在下確實拿你們沒辦法!
_(:3)∠*)_好睏好睏,數據科學我比較擅長但是下回分解吧(:4[____]幫忙關下燈謝謝科學是人們在生產和社會實踐中概括和和總結出來的理論體系,這些理論具有客觀性和正確性。統計學作為數學的分支,完全符合科學的定義,且統計學從一開始就是嚴格遵從科學的定義來發展的。數據科學也有研究因果關係的,比如經典的分類演算法,有很明確的因果關係描述。所以樓主一定要相信自己,相信科學,同時要相信數據科學,這東西是具有客觀性和真理性質的學科。建議樓主學習一下邏輯學,以後再看到這樣的同學,要發揮出你作為長者的經驗和長處,好好指導一下這些拿衣服的。
數據科學當然是科學啦,ZJU數學系2015年就開設了新的一個研究生方向叫數據科學。其他學校應該也會在這幾年開設。
儘管個人也不喜歡統計也學不好統計,但是不得不承認其科學性,並且具有強大的應用性?
林彪靠這個打仗出名的
不是偽科學,統計學就是關於數據的學科,按照這個意思,統計學可以取消?自己對相關專業不熟悉,不夠了解,是沒有資格評價的。懂的人除外
推薦閱讀:
※科學是否值得人們完全信任?
※性別有沒有可能存在智商差異?
※為什麼建國以來中國大陸沒有出現大師級的學者?
※那些國外的心理學家研究的那些心理現象,在我們國內是否也適用?
※數學理論是不是因其極強的邏輯性而很少出錯?