技術不是大數據第一生產力,數據交易才能帶來應用爆發

導言:我從事大數據工作10餘年,很多時候和圈內朋友談及大數據,大家首先談到的都是數據挖掘和人工智慧演算法,或是hadoop的架構。我也曾深陷這樣的誤區,認為「只要會寫演算法、實現架構就是大數據的全部」;但我這些年的應用實踐中,越來越發現,阻礙大數據發展的最大瓶頸不是技術,而是高質量數據源的獲取、提供和交易環節沒有被打通。

技術不是關鍵,高質量的數據源永遠是第一位

大數據行業很多新人,甚至業內多年從業者都有這個誤區:認為演算法、模型很重要。而我認為,即使技術達到世界頂級水平,它依舊不是大數據價值引擎,高質量數據源永遠是最重要的價值來源。

模型的成功必須依賴於高質量數據源和對商業的理解能力有沒有數據,數據質量如何,這是最為前置的條件。要有數據才能夠建模;模型也必須經過數據應用,才能促進其完善。其次,模型往往是要基於商業目標的,要思考如何用既定的數據解決現實商業問題,不是為建模而建模。一個模型質量和效果,從某種意義來講,取決於數據源的運用、宏觀的架構能力以及對於商業的理解,並不是技術本身。

生產大數據價值的原料是數據源本身,模型是工具。脫離了工具,數據源不會因此而失去價值,但脫離了數據源,模型的價值蕩然無存。這就是為什麼在黑市裡面交易的是購房者、貸款者和企業主的個人資料,而不是數據挖掘模型。

沒有數據交易,高質量數據源的潛能被禁錮

目前能夠做大數據實踐的,都是自身擁有大數據的部門或企業。最優質、最有價值的數據源往往掌握在政府、運營商、銀行以及像BAT這樣的大型互聯網公司。高質量數據源擁有者總是缺乏開放的必要性和動力,甚至希望對數據進行壟斷。但由於內部大數據應用的需求和場景往往較為單一,數據擁有者往往也沒有很好的變現產品和手段。

再加上數據獲取困難、缺少數據採集意識造成的數據缺失,以及信息安全、信息歸屬權等敏感性問題,大數據仍然非常小眾,看起來很高深,對於絕大多數人來說很陌生的。

但是,高質量數據源偏偏是需要流動和使用,才能激發其巨大的價值潛能。在封閉環境下,數據的價值並沒有完全地發揮出來。以運營商數據為例,運營商數據不僅可以用於解決其自身的生產運營、精確營銷等問題,在商業選址、城市商圈規劃、制定企業營銷策略等很多領域都大有可為。

假設我們要為一家高級女裝店鋪進行選址,現有的選址方法只能夠告訴你周邊的人流量,卻不知道你周圍到到底有多少真正的潛在客戶。當我們藉助運營商數據,把客戶畫像、位置信息等數據能力輸出到這個場景中,便能依據周邊人群的特徵、年齡、消費力等數據,作出精準決策。

但實際上現在的商業選址是很粗放的。問題在於數據的交易環節沒被打通,數據能力無法輸出,導致需要用數據的人沒有數據,甚至也不知道數據能帶來什麼價值。只有實現數據拼接,才會帶來數據價值的裂變式增長。因此,未來的IT時代向DT時代的轉變,關鍵在於打通高質量數據源的獲取、提供和交易環節。

打通交易環節,才能帶來應用爆發

打通交易環節,一方面能讓沒有數據的人用上數據,讓數據在更多地方發揮價值;另一方面,數據擁有者有更多的途徑去輸出大數據能力,實現變現。數據的價值不會因為開放和應用而減少,相反,應用與數據的價值是相輔相成的,用得越多,數據越多;而所產生的數據,又會反哺更多的應用。

再者,高質量數據源的跨行業、跨領域流動,必定會帶來是帶來應用創新。金融徵信已經應用大數據進行創新。且看芝麻信用的數據來源,涵蓋了在線購物、與他人資金往來、還信用卡、資金理財、公用事業費繳納、房屋租賃或買賣、跳槽情況、婚姻狀態、社交關係等。

以往如果一個人沒有房產,沒有固定職業,會被認為償還能力低。而現在把社交關係、與他人資金來往、跳槽情況等等不同領域的數據整合,可能會發現有的人雖然沒有房產,但租的是高檔住宅;雖然沒有固定的聘用方,但經常出沒於CBD寫字樓和高端消費場合,顯然有相當的收入與償還能力。數據的跨領域應用,對於拓展信貸、分期付款業務都有很高的價值。

國務院2015年印發的《促進大數據發展行動綱要》明確了要統籌國家大數據資源,推動共享開放,釋放數據紅利。這裡釋放了一個積極的信號,表示數據資源將逐步放開,利好數據流動。

在保證信息安全的前提下,打通數據交易環節,會迎來數據應用的爆發。而基於整合數據的跨行業、跨領域數據應用創新,將會是大數據未來又一個風口。

結語

我們雖然希望數據交易能夠帶來應用的爆發,但是在現階段高質量的數據源仍普遍缺失。在現有情況下,我們並不是什麼都不能做。大數據講究的是「量體裁衣」、「看菜吃飯」,即有什麼樣的數據,就做什麼樣的事。在信息安全敏感程度較低的領域,逐步試錯,去嘗試對接數據資源,才能在數據交易即將帶來的應用爆發時代搶佔先機。

本文作者簡介

江穎,帷策智能、原力大數據創始人兼CEO,大數據應用實施領域資深專家,中國大數據商業實踐先行者。自2003年起,一直致力於大數據領域的研究及應用實踐,深度涉入通信運營商、移動互聯網、零售、服裝、教育等多個行業,擁有大量的行業經驗和研究成果。

廣州帷策智能科技有限公司

廣州帷策智能科技有限公司致力於大數據研究及應用項目,積累了豐富且深入的大數據實踐經驗與成果。尤其擅長基於大數據的分析建模、能力固化和產品研發,力求幫助客戶透視業務全景,實現量化決策、精準決策和科學決策,高效提升市場營銷及運營管理能力。

官網:wislife.cn

合作聯繫:020- 85279103 微信 jesich

備註:本文為原創文章,轉載請註明作者及公司。


推薦閱讀:

三組數據帶你了解知乎現狀
大數據5件能做和不能做的事
讀阿里巴巴中台戰略筆記
雨沐田:說說政府開放大數據
技術精品課大放送:學習雲計算大數據,這些技能必不可少

TAG:大數據 | 數據分析 |