標籤:

春節閑思

首先,「農民搞計算機」祝大家春節快樂,萬事如意。打牌的把把都贏,喝酒的千杯不醉,搶紅包每次搶個最大的。

這幾年,雲計算、大數據、移動互聯網已經是人人皆知的辭彙,這主要得益於中央領導人在公開場合的大力宣傳。對於大數據,其實我了解得不是特別多,幾年前看過一本英國人寫的《大數據時代》,個人覺得,在科技著作上,老外還是比較靠譜一些,不像國內的某一部分作者一樣那麼浮躁,出書的速度奇快,但內容往往東拼西湊,讓人看了索然無味。《大數據時代》這本書沒有具體的技術細節,主要講大數據的背景、來源等。如果有太多技術細節,估計這本書的流行範圍也不會那麼廣。作者強調,大數據主要研究的是相關關係,舉個簡單的例子:國外有一個超市研究發現,很多男人在給孩子採購完尿片以後,會再去買幾瓶啤酒。於是超市並將尿片和啤酒擺放在一起,增加兩者的銷量。那麼採購尿片與採購啤酒存在因果關係么,顯然沒有。 那麼這兩者之間的關係是通過採集大量的數據樣本分析出來的,如果使用傳統的統計方法,則比較難分析出這兩者之間的關係。這兩者之間是相關關係。

現代科學技術研究的是因果關係。醫生分析大量病人數據,做大量小白老鼠實驗,最終研究出某一種病的成因,得出某一種藥物可以治療某一種疾病。橋樑建築專家通過大量的測量數量,反覆計算,最終計算出橋樑需要多大的橋墩,橋墩里需要加多少的鋼筋。以上我舉的兩個例子,是現代科技中最常見的研究方法。這兩個方法的特點是數據樣本有限,而且每一個樣本都是有效的。數據樣本有固定格式,比如,醫生記錄的數據,有病人的性別、身高、體重、年齡等規範格式。而大數據分析的樣本一是量非常大,二是數據格式不固定,不是結構化的數量。要得到海量數據,則需要將許多平時看似無用的信息收集起來,還需要海量的存儲來存放這些數據。

春節這幾天,我在家裡帖對聯、做包子、維修電線線路等忙得不可開交,忙裡偷閒,偶爾也在思考一些農村裡常見現象。比如,鄰縣據說有一個乞丐的墳墓,據說很靈,有些人一直懷不上孩子,聽聞了此事,到那個墳上拜一拜,沒過多久就懷上了。於是一傳十,十傳百,在兩個縣城都流行開了。在很多人看來,祭拜這個墳墓與懷上孩子兩者之間屬於因果關係。因為有了這個行動,所以懷上了孩子。這兩者之間我覺得只是一種偶然,還沒有到相關關係。類似的這種偶然性在生活中隨處可見。農村還有其它的風俗,比如正月初一早上不能把湯加到飯裡面,否則正月出門時會下雨。小孩子不能吃狗肉和甲魚,因為這兩種動物比較「陰」,這個字我不知道用普通話怎麼表述,所以直接將方言翻譯過來。

我是一個土人,不愛喝酒與打牌這兩項在農村的春節最流行的活動,今天終於比較有空,胡亂寫了一些東西,歡迎大家與我討論。

推薦閱讀:

何以解酒,唯有「杜康基因」
春節將至,有什麼整理、打掃屋子的技巧?
有什麼適合春節與父母一起看的電影?

TAG:春节 |