標籤:

大數據交易的「上海模式」,底氣在哪裡? | 數據科學50人·湯奇峰

如今,我們每個人都在談論「數據科學」,《哈佛商業評論》雜誌甚至將數據科學家定義為「21世紀最性感的職業」。在這個大數據時代,究竟什麼是數據科學?數據科學家又究竟是怎樣的一群人?他們在創造著什麼令人著迷的東西?DT君將在2018年走訪50位來自各行各業的頂尖數據科學家,希望能讓你們了解這些神奇的人和他們的神秘事兒,為你們一窺數據科學的未來與未知。

湯奇峰,學管理出身,曾任谷歌中國區大客戶部總經理,自此和技術、數據、市場結下不解之緣。『數據科學50人』選擇湯奇峰作為訪談對象,源於其在數據交易領域的最新市場化探索——目前他帶領著年輕的上海數據交易中心,試圖從技術、市場維度,探索出一套具有上海特色的數據交易商業新模式。

「數據孤島」越來越大了?

最近,知名獨立媒體人、零點諮詢創始人袁岳在一場演講中針對國內的數據開放現狀發表了一番感慨:「我們今天依然沒有大數據,只有大的數據孤島。每一個人都抱著自己的數據,實際上還是一個數據孤島,而且孤島比以前更大了。」

這種看法,點出了國內大數據應用方面的一大「軟肋」:企業往往對自家的數據「看得很緊」,只想從別人那裡得到數據,卻不願意拿出數據。其結果就是很多數據都被鎖在了「籠子里」,沒能發揮更大的融合的價值。

怎樣讓數據更高效地流通融合?在大數據業界,已經開始嘗試一種商業化模式:成立數據交易中心或是交易所,加速大數據的合法買賣和流通,也就是說,你可以在交易中心合法買到其他公司提供出來的合法數據。

2015年以來,從貴陽、到武漢,再到上海、重慶、杭州、哈爾濱等地,數據交易機構、公司的數量逐漸多了起來。這其中,既有政府許可的、也有民資的各類創業公司(以API介面作為交易方式)。

民資背景的大數據交易平台「發源地大數據」創始人馬建軍較為樂觀,他透露,2015年以來,大數據交易的市場規模擴大了將近10倍,預計2017年的交易額有200億元左右。「總體上是一片藍海」。

在馬的認知中,政府許可的機構以及民資背景的企業各有優勢,而政府許可的交易機構可能會在政策層面參與地更深。

DT君的問題也恰恰在於此。政府許可的數據交易機構的數據交易模式是怎樣的?會從實際層面為打破「數據孤島」帶來哪些改變?進一步開花結果的障礙在哪裡?帶著這些問題,DT君專訪了上海數據交易中心CEO湯奇峰,希望一探大數據交易行業的現狀、了解行業的困局與方向。

政府支持的機構,怎麼做數據交易?

去年12月剛入選「2017年上海領軍人才培養計劃」百人名單的湯奇峰,是大數據應用企業晶贊科技(上海數據交易中心的技術支持方及股東之一)的創始人。他掌舵的上海數據交易中心,是一家由政府許可並批複、國資民資共同參與的混合所有制企業。目前,該中心也是「大數據流通與交易技術國家工程實驗室」的承擔單位、國家大數據交易標準化試點單位。

2016年4月,上海數據交易中心正式掛牌,中心是上海市大數據發展「交易機構+創新基地+產業基金+發展聯盟+研究中心」五位一體規劃布局內的功能性機構,承擔著促進商業數據流通、跨區域的機構合作和數據互聯、政府數據與商業數據融合應用等工作職能。

(圖片說明:由上海數據交易中心承擔建設的上海大數據應用展示中心)

相對於2015年4月成立的中國首個大數據交易所——貴陽大數據交易所,以及之後陸續推出的10多家類似機構,上海數據交易中心並非國內最早。但作為一種新生的商業模式,在公司成立之初,湯奇峰還是花了很多時間向外界解釋:什麼是數據交易?公司的模式是什麼?

湯曾向媒體舉了這樣一個例子:張先生是一位廚師,正打算從金融企業借錢買一款手機,金融企業必然要做風險評估。第一步,金融企業需要判斷張先生是否真要拿錢去買手機。這個時候,大數據可以知道,張先生最近是否訪問過京東、蘇寧等購物網站;第二步,金融企業還需要判斷張先生是否真的是廚師。這時候,同樣是通過大數據,可以了解到張先生是否連續在固定地址上班;第三步,還可以看張先生的手機號碼是新開通的還是老用戶,有沒有固定的社交圈,甚至他在航空公司的旅行記錄,還可以幫助確定其收入。

對於上述例子中的這一類金融企業來說,以往要獲得各種數據,需要到處「拜碼頭」,尋求數據合作。但成立數據交易中心後,分散在各處的數據源可以在這裡集中起來交易。在交易的過程中,還要對數據是否涉及用戶隱私問題進行評估(必要時要對數據脫敏處理)、數據的確權、定價、數據質量的認定等一系列工作。工作雖然複雜,但因為集中化,因此往往效率更高。

出於對數據安全、隱私和風險評估等方面的考慮,上海數據交易中心目前採取的是會員制,交易並不對個人開放,而只是面向企事業單位。所有有意向的成員,第一步都需要提交申請材料,通過審核之後才能獲取成員賬號。而不管是數據的供應方還是需求方,都需要承擔相應的權利和義務。

對於數據的供應方,需要按照一定的標準,對數據的屬性進行準確描述,然後才會進行掛牌。而數據的需求方則可以在交易平台查詢、選擇數據供應方的可供應產品。

至於數據的定價,需要經過供應方密封遞價進行競價,需求方擇優選定之後,才會生成數據商品訂單。

「數據交易在國內總體上還是比較新的事物,但已經有越來越多的企業開始接受這種模式。」湯奇峰向DT君表示。

對大企業之間來說,可能會有數據互換的需求,而對於更多的中小企業,對於數據價值的認識本身也在提升,「讓數據變現」成了很多企業願意嘗試的。

「上海模式」有何不同

對於上海數據交易中心這類由政府許可的機構來說,在大規模市場化之前,先建立一套交易的準則,更注重數據的安全、隱私的保護,是其主要特點之一。

這樣的事情,各地的類似數據交易中心也都在做。上海的優勢和獨特之處又在哪裡?

面對DT君這樣的提問,湯奇峰的回答也很乾脆:上海這座城市,就是最大的優勢所在。

他坦承,上海數據交易中心成立的時間並不早,但在數據的流通方面,早在2012年上海就已經有相關的研究。而上海一貫的特點是「謹慎而務實」,做了充分討論,但步子在最初並沒有邁大。

「儘管上海並不是第一個成立數據交易中心的,但為什麼國家會把大數據流通和交易技術的實驗室放在上海數據交易中心?我之前去項目現場答辯的時候,就強調了這樣的因素:上海人才和科研機構眾多,多年來在信息系統上已經產生了重要的基礎和支撐。要想在數據交易和流通方面有所突破,普惠整個行業,把大旗交給上海是再合適不過了。」他進一步補充。

上海的天然優勢有不少。比如,上海本身是金融的中心、航運的中心,比較早地感受到了數字時代,一是數據資源豐富,二來從市場的迫切性來講,也有數據資源重新配置的需求。而在其他經濟本身不太活躍的地區,對數據要素的需求顯然也是不太活躍的。

而在上海數據交易中心的一整套模式和做法上,也有著上海這座商業城市的鮮明特點。

先是公司的性質,不同於國內其他數據交易中心要麼由民資、要麼由國資主導,上海數據交易中心的成立則是由政府許可並批複,企業來共同參與,屬於國有控股混合所有制企業。在發起單位中,既有上海市信息投資股份有限公司、中國聯通、中國電子等國企,也有如晶贊科技、萬得、萬達信息這樣的民營企業。用湯奇峰的話來說,「政府牽頭、民企也參與,既兼顧了數據交易的公信力,也更有效率。這就是大數據交易的『上海模式』。」

另外一方面則是其濃厚的技術特色。雖然各地的數據交易中心都在做自己的研究,但各自的方向和側重點有所不同。和國內其他數據交易中心的重心要麼側重市場拓展,要麼是行業整合等「對外」事務上不同,上海數據交易中心的技術色彩更濃。

在國家設立的11家大數據領域的國家工程實驗室中,上海數據交易中心承擔的實驗室是唯一一家以大數據流通與交易技術為重點方向的。

(圖片說明:上海數據交易中心目前是大數據流通與交易技術國家工程實驗室的承擔單位。)

說到交易技術,很多人可能不太理解,但這卻是和每個人密切相關。比如,在數據傳輸流通中,最令人擔憂的往往就是個人信息是否安全。而通過一系列交易技術,能夠實現對個人信息的保護。

去年9月,上海數據交易中心和公安部第三研究所共同研發、推出了數據流通xID標記技術。這種技術組合了數據分類規則、不可逆標記生成、傳輸控制等多項技術,使得交易數據無法識別個體且不能復原個人信息,形成的無特定標識的個體標記數據。

同時,基於真實應用場景,在數據流通規則控制下,在線實現數據的合規按需獲取。

有了這類技術,數據流通中的個人信息安全就有了保障。

除了技術,上海數據交易中心還有一大特色:「不做產品」。

所謂不做產品,指的是不做標準化的產品,而是更關注基於場景的應用。目前,上海數據交易中心提供的服務主要聚焦市場營銷、金融風控這兩大應用板塊。「沒有應用場景的數據流動本身就是非常流氓的做法,因為數據流動會產生很多社會、法律問題,對於數據流通的邊界需要有預先的感知,我們覺得在什麼場景下使用是非常重要的。」湯奇峰稱。

「解決數據孤島並不難,難的是思維轉變」

2015年,在貴陽實現了中國首批大數據交易,據《貴州商報》當時的報道,在首批數據交易中,賣方中出現了騰訊的身影,而買方則包括京東。

在某些特別的資本運作或商業聯盟下,部分擁有豐富數據資源的科技巨頭對數據交易這種模式,似乎並不排斥。但在促進數據流通的過程中,對於更多的企業來說,所謂的「數據的孤島效應」是個繞不過去的檻。

一般而言,很多企業都比較在意數據的權屬,不太放心將自己的數據拿出來交易給別人,但對別人的數據卻都虎視眈眈。

發源地大數據創始人馬建軍此前向DT君表示,除了政府層面促進各個部門的數據開放,以及大企業出於對各類數據的巨大需求,有可能會互換數據外,如何讓更多的中小企業也參與數據的共享、融合,是「數據孤島」最大的問題所在。

而在湯奇峰看來,要解決這樣的問題,讓更多的企業願意拿出數據,思維的轉變是重要一步。

湯奇峰覺得,單純就數據交易來講,孤島的問題並不難解決,因為企業所需要的數據的供應商往往不是唯一的。

他舉例說,比如中國民航信息集團(中航信)擁有一部分國人乘坐航班的數據,通過中航信也許可以獲得這部分數據。但是中航信並不是唯一的供應商。

儘管不是每個企業都願意拿出數據,但是也有一些公司在業務發展過程中,思維會比較開明,覺得既然數據是資源,那麼就應該在流動過程中發揮價值,讓其「變現」。

比如,有一些航空公司在想清楚這個問題之後,就可能會把數據拿出來。如果有一兩家這樣的航空公司,再加上機場方面的一些數據,是可以拼接出一份完整度較高的數據的。

因此,湯奇峰認為,數據的來源是完全可替代的。

「我覺得其實所謂數據孤島不是數據的孤島,而是數據思維的孤島,當企業真正想清楚了,問題就簡單了。你需要別人在數據方面幫助你的同時,其實你也需要對別人做相應的支撐,要有相應的社會角色。數字經濟本身就是一種分享經濟,這種數據的分享,當然不是沒有代價的。」他說。

除了數據的分享,要打破數據思維的孤島,促進數據的流通,加強企業內部的數據治理也是重要一步。

「很多時候,有些企業會感嘆說沒有數據,其實企業對於自己的內部有什麼數據並沒有進行梳理。」

在湯奇峰的觀察中,一些企業的內部數據往往就已經能解決很多問題,而且現在很多企業本身也不是孤零零地存在,而是在整個供應鏈的鏈條上。即便企業本身數據不多,跟上下游的企業也是可以談數據合作的。

行業發展的最大挑戰在法律的「缺位」

在上海數據交易中心網站提供的資料中,展示了其自行編製的一系列適用於其平台的規範化的交易準則和標準文件,比如《數據互聯準則》、《個人數據保護原則》、《流通數據處理準則》、《流通數據禁止清單》等。

DT君發現,像是《流通數據禁止清單》中,就包含了涉及特定個人、特定企業權益、或者是危害社會穩定等數據類型。而在《個人數據保護原則》中,也強調了數據的持有人應該自覺維護數據主體的合法權益。

之所以列出這麼多的準則,在很大程度上和適用法律的不明確有關。

湯奇峰表示,對於數據交易中心這類機構來說,發展遇到的最大挑戰就在於對法律的把握。目前,國內沒有出台個人信息保護法,因此,在數據的流通過程中,企業方對於哪些數據不能流通、哪些環節和應用的場景可能和法律有衝突,會出現一些不太容易把握的情況。

「其他像是商業機密數據的問題,都已經有刑法或其他法律的規範。目前對整個行業影響最大的就是在個人信息這一塊」。

儘管面臨挑戰,湯奇峰還是在專訪的尾聲中表示看好數據交易行業的前景。

他最後說道:「在人類沒有發現石油之前,當然沒有人去使用石油。數據也是一樣,當你有數據的意識之後,對數據的使用就會產生較強的需求,自然會形成一個數據資源配置的市場。」

結束專訪的DT君不免唏噓,數據孤島的破與立實際上對於不同的人,站在不同角度看,有很不同的狀態,但對於大部分人與商業體而言,孤島效應依舊存在。大數據產業早已是國家戰略,而交易流通依舊面臨技術、商業關係以及思維等阻礙。作為「數據科學50人」的又一訪,我們領略了數據交易人的故事,局內人無不是「路漫漫其修遠兮,吾將上下而求索。」

文 | 胡世龍: hushilong@dtcj.com

題圖 | 視覺中國

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。

關於數據科學50人

數據科技50人項目是DT財經旗下數據俠計劃重點內容產品,旨在與數據科學領域KOL共同挖掘數據內容的價值。我們從商業數據科學領域選出最具代表性的50位先鋒進行深度專訪,50人由DT財經獨立評審並發布,第一財經數據科技及合作夥伴傾力支持。

往期回顧:

+ 王煉 + 宣曉華 + 丁宏偉 + 沈志勇

數據俠門派

本文數據俠湯奇峰,上海數據交易中心CEO,上海晶贊科技發展有限公司創始人,2017年入圍「上海領軍人才培養計劃」、上海智慧城市建設領軍先鋒。中國大數據流通與交易技術國家工程實驗室理事會理事長、中歐數字經濟專家組中方專家。曾任谷歌中國區大客戶部總經理。

加入數據俠

「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。

weixin.qq.com/r/qTkRCcb (二維碼自動識別)

推薦閱讀:

大數據計數原理1+0=1這你都不會算(二)No.50
筆記 | 如何選擇一個靠譜的物聯網平台
RDD論文翻譯:基於內存的集群計算容錯抽象
中華財寶:珠寶行業在大數據時代該如何前行?
三個月成為大數據工程師,你需要具備哪些條件?

TAG:大數據 |