「大數據」,不遙遠(圖)
薛世君 「大數據」的概念,這兩年熱得燙手,僅在去年,就有超過20本以大數據為主題的新書面世。在麥肯錫發布的一份報告中,已經將數據分析稱為「下一個創新、競爭和生產力的前沿」。《大數據》一書作者塗子沛更是斷言,面對海量數據,誰能更好地處理、分析數據,誰就能真正搶得大數據時代的先機。 「大數據」是什麼?業內專家能給出各種讓技術盲們雲山霧繞的答案和解釋,什麼「處理模式」、「信息資產」、「4V特點」之類的。有人可能會覺得這比較專業化、技術流,太高深莫測,因此也就離大家的生活比較遙遠。其實「大數據」已然無孔不入,離我們近得很,與衣食住行休戚相關。本地電商鄭州雲超市,據說將來可以通過你的購物記錄,分析出你的消費傾向,在你家醬油快要用完的時候,適時地將你喜歡的品牌的醬油,送到你家門口。 「大數據」運用的一個經典案例是,在甲型H1N1流感爆發前幾周,谷歌公司通過觀察5000萬條美國人最頻繁檢索的詞條數據,發現「哪些是治療咳嗽和發熱的藥物」這一主題的檢索頻率大增,進而準確預測了流感的發生及傳播範圍。 通過數據挖掘,沃爾瑪的研究人員發現四成左右的年輕爸爸在購買嬰兒尿布時會順手買點啤酒犒勞自己,便對這兩種商品進行捆綁銷售,結果銷售量雙雙增加。淘寶的數據顯示,中國比基尼賣得最好的省份,不是氣候炎熱的廣東、海南,而是新疆和內蒙古,是不是有點匪夷所思?難怪有專家說,「大數據最要命的是什麼?就是任何數據我都能匯總起來,分析你,比你還了解你自己」。這就是大數據的價值。 微軟紐約研究院的經濟學家大衛·羅斯柴爾德,這兩年每到奧斯卡頒獎就出盡風頭,因為他已經憑藉「大數據」基本成功預測了兩屆奧斯卡獎。他通過收集投票數據、預測市場數據、基礎數據和用戶生成數據,如賭博市場、好萊塢證券交易所等大量公開數據建立預測模型,並開發了一個軟體挖掘數據,從而得出科學的分析預測結果。去年,他成功預測了24個奧斯卡獎項中的19個,今年則成功預測了24個獎項中的21個,向人們展示了「大數據」這一現代科技的神奇魔力,令人嘖嘖稱奇。 儘管電影拍得很爛,但郭敬明恐怕是國內導演中拍片運用「大數據」的先行者之一。他的團隊會關注電影的話題討論度、百度指數、搜索量,通過購買受眾的年齡、性別、教育背景、地域分布,以及第幾天票房最高、一天里哪個時段票房最高等數據,再整理、對比,分析大家喜歡什麼、不喜歡什麼,進而對劇情和鏡頭進行改動、取捨。比如《小時代》中被詬病的名牌服裝,數據顯示粉絲們很喜歡;有人抱怨女孩子之間卿卿我我的戲太多很無聊,但數據顯示女性觀眾很感動。於是,根據數據分析,在拍續集時強化觀眾喜歡的橋段,改掉不受歡迎的情節,這或許正是《小時代》系列電影在口水吐沫中票房一路走高的奧秘所在。 歷史學者黃仁宇先生在其著作中反覆宣稱,中國曆來不擅長「數目字管理」。「大數據」其實就是高端的「數目字管理」,雖然不擅長,但抓緊學習、迎頭趕上,為時未晚。7 畫中話 據《北京晨報(微博)》9月10日報道,遼寧大連普蘭店市皮口鎮,是大連周邊海域養殖海參最大的一片區域,由於養殖戶大量添加抗生素等藥物,導致近海物種幾乎滅絕。專家介紹,消費者長期食用抗生素過量殘留的海參,會使人體腸道中的微生物平衡受到影響,對健康不利。7 圖/陶小莫
本文來源:大河網-河南日報
推薦閱讀:
※今日數據行業日報(2017.5.19)
※『2021年中國搜索廣告收入將接近549億美元』今日數據行業日報(2016.08.29)
※『究竟要賺多少錢才能快樂?』今日數據行業日報(2017.6.8)
※3-Hive基礎語法
※今日數據行業日報(2017.02.28)