標籤:

現階段我為什麼不看好純粹的數據交易?

導言:

普通人發現,自己的隱私在不斷被暴露,不是房屋中介就是股票推薦;

一般企業會說,「大數據就是騷擾電話和簡訊」、「能不能幫我找到客戶發簡訊、打電話」;

業內人都清楚,現階段大量的數據交易實際上就是客戶隱私數據和敏感數據的出賣,並且已然催生了龐大的地下產業鏈;

現階段的 「數據交易」,多限於個人身份、企業基礎信息的核實驗真,而更多的是客戶隱私數據的黑市交易。

儘管大數據交易平台建設正值爆發期,數據交易號稱的市場規模也在不斷壯大,同時也有國家大力的政策支持。但是短期內,我仍然不看好數據交易,因為現階段的數據交易缺乏了必要的基礎構建。

一、普遍缺乏大數據認知,不知道大數據能做什麼

在大數據產業中最重要的因素是人,而在數據交易中,交易雙方必須對數據有清晰的認知、理解。但在現階段,大數據剛剛起步,絕大多數的行業、企業對於本身數據、數據如何使用並不清晰。所謂認知理解基礎,指的是知道「我能用數據做什麼」、「別人的數據對我有什麼作用」、「我的數據對別人有什麼作用」等等。

理想的數據交易是數據提供方與需求方能夠進行對接,解決企業之間的數據缺失問題,完善數據價值。但大數據的能力和價值是抽象的,大部分是非直接的,這就導致很多人對數據價值的認識不到位,甚至不同位置的人之間也存在著嚴重的斷層。

很多時候做搜集數據工作的人不知道拿數據做什麼用,作數據分析的掌握不了數據質量,營銷策劃人員不知道數據能夠幫助他們做什麼,管理者會發現大數據的應用沒有達到預期的效果。

再者,對於數據交易這個前所未有的領域,作為數據提供方、數據需求方或交易平台管理者,不同的角色該怎麼發揮自己的作用,大家能夠促成什麼事情,其實很多人在思想上都是沒有做好準備的。

二、缺乏數據交易基礎,高質量數據拿不出來

口徑不一致,有數據卻用不了

數據口徑必須要極為明顯、確保一致,才能保證後續高效利用。在建模分析中,對於所研究的變數,必須搜集、整理其時序的或某個時點的橫斷面數據資料,它們是建模的物質基礎。這些數據資料的質量,直接關係到模型的質量,影響我們對數據的應用。

然而,大數據對於大部分行業都還是新鮮事物,部門、行業間存在嚴重的數據壁壘和孤島現象,很多數據口徑不明晰,別人讀不懂你的數據;又或者同類數據口徑不一致,沒有辦法合併同類項。

就拿大數據徵信舉例,不同部門的信用評級標準不一樣,很可能對於同一個的評估結果就有天差地別。這時候該相信誰,該採用誰的標準?大數據本應是告訴你答案的,而不是讓你陷入新的難題。但如果沒有明晰、一致的口徑,數據就不能幫助我們解決問題,數據交易又有什麼意義呢?

數據拿不出來,躺著睡大覺

數據交易要發揮作用,必須要有高質量數據集的參與。但眾所周知,越是高質量的、具有核心競爭力的數據,就越是容易涉及信息安全、信息敏感等問題,因此越是被高度保護、無法獲取。

幾乎每天新聞都會曝光非法的數據交易,利用各種社交工具售賣學生個人信息、銀行卡卡號密碼等等。明明是非法的勾當,卻還是有那麼多人以身試法,正說明了目前正規交易市場的數據其實遠未能滿足商業需求。

數據交易不應該觸碰到用戶個人隱私信息、敏感信息這條紅線,那如何在不觸碰紅線的前提下,輸出數據的能力,跟其他數據進行拼接,這是我們需要長時間不斷探討的問題。而現階段的數據交易並沒有辦法釋放這部分的數據能量。

可讀性不足,數據形同虛設

我們有個客戶,手頭上掌握的數據能夠幫助同行業的一些企業來做精準營銷,但他的數據既有文本、又有數字,且規範性差,可讀性非常的弱。有些政府數據也是如此,雖美其名開放數據,但數據孤島、數據結構性差等問題大量存在,沒有辦法被機器讀取。

像這樣的非結構化數據其實不在少數,而且大都蘊藏著巨大的價值,但需要大量的時間、人力物力去做清洗、處理。這些基礎工作在現階段並沒有做好,所以數據也就難以實現拼接和大規模流通。

三、缺乏制度基礎,交易環境不明朗

數據交易下,隱私和安全問題是社會最關注、最敏感的問題。隨著大數據時代的到來,過往的法律法規並不能簡單地套用到數據交易的場景中,需要制定特定的制度、法規。否則數據交易將會長期處於一個尷尬的境地,進退兩難。

此外,行業與行業之間、企業與企業之間目前仍然沒有數據互通的意識或共識,大家對於自己所擁有的數據還是持十分謹慎保守的態度。但未來這種態度必須要轉變,因為跨界數據的整合才能夠帶來大數據應用的爆發。

四、數據交易要蓬勃發展,把數據「拿出來」是關鍵

我認為數據交易是趨勢、是未來,但由於不具備上述基礎,現階段還很難發展。在這些基礎之上,最本質、最核心需要解決的是高質量數據「拿不出來」的問題所謂「拿不出來」,意思是數據變現必須運用間接的方法,而不可能通過純粹的原材料買賣來變現。

要怎麼把數據「拿出來」,第一,必須要形成一套口徑統一的標籤體系。通過長期摸索,當標籤極其規範時,我們就能夠以標籤化輸出代替原始數據輸出,信息孤島才能夠被打通。

第二,是要形成行業與行業、企業與企業良好的信息共享機制、保密機制,完善的法律法規,數據交易才能夠順利地進行,健康發展。

同時,像我們做大數據的公司,其實還肩負大數據普及教育的使命——提升大數據意識,培訓大數據能力,激活企業大數據資產。要告訴企業大數據是什麼,能幫你做什麼;然後深入探討交流,分析你所具備的能力,有什麼需求;還要給企業做大數據培訓,做能力建設等。

結語

我曾經提出「技術不是大數據第一生產力,數據交易才能帶來應用的爆發」,但數據交易絕對不是純粹的數據原材料買賣,否自在未來將會喪失核心競爭力,藉助大數據做一些現在做不到的事情,才是大數據交易蓬勃發展的未來!

本文作者簡介

江穎,帷策智能、原力大數據創始人兼CEO,大數據應用實施領域資深專家,中國大數據商業實踐先行者。自2003年起,一直致力於大數據領域的研究及應用實踐,深度涉入通信運營商、移動互聯網、零售、服裝、教育等多個行業,擁有大量的行業經驗和研究成果。

原力大數據(廣州帷策智能科技有限公司)

廣州帷策智能科技有限公司致力於大數據研究及應用項目,積累了豐富且深入的大數據實踐經驗與成果。尤其擅長基於大數據的分析建模、能力固化和產品研發,力求幫助客戶透視業務全景,實現量化決策、精準決策和科學決策,高效提升市場營銷及運營管理能力。

官網:帷策:知識就是力量,數據就是能量

合作聯繫:020- 85279103 微信 jesich

本文為原創文章,轉載請註明作者,並附帶作者及公司簡介。


推薦閱讀:

大數據時代來了,你準備好了嗎?
使用kaggle API 快速download 數據
數據標準化:數據資產化從0到1的起點
【總結】2017年最值得收藏的可視化案例
中華財寶:珠寶行業在大數據時代該如何前行?

TAG:大數據 |