數據交易的幾個問題

信息化發展幾十年,「大數據」這個詞非常形象的說明了我們的數據存量---非常大,大到我們有點不知所措。數據本身是生產資料已成為社會共識,是我們的勞動對象。通過對生產資料加工再造生產出新的"產品",不同於常見的商品,它可以是新的數據包,也可以是特定的數據服務。有了勞動對象,圍繞勞動對象又有了一系列勞動資料(伺服器、存儲、大數據加工工具、分析工具等),逐步形成了一個新的產業---大數據產業。

數據作為產業的核心,既有商品的屬性又有金融的特點,它具有明顯的商品屬性,可以被加工、流轉;它有金融特點,並不單獨存在而是依附在社會生產、生活的各個方面,如同資金一樣,企業用好它,可以降低生產成本、提高運行效率,而且越使用價值密度越高,除了多出幾塊硬碟,永遠不用擔心通貨膨脹的問題。

數據本身的特性給很多傳統概念帶來了挑戰,我們可以說遊戲幣等虛擬物品是商品,但不能說金融/錢是商品;在財務會計中,我們很難直接把數據歸到原材料、產品或是存貨的科目下。但如同金融,數據的流通速度直接決定了產業發展和社會運行情況。談到流通,我們就要說數據的共享和交易,數據共享的場景比較多,我們這篇文章暫且不談(也可以理解為交易價格為0的特殊情況),先圍繞數據的交易說幾個問題。

問題一,數據交易中確權、估值、計價是影響數據交易發展的關鍵問題嗎?

這些是問題,但顯然不是關鍵問題,甚至目前來看都不是重要問題。先說確權的問題,誰有數據?個人、企業、政府。關於個人數據,國家已有明確的法律隱私保護條款,個人在社會活動中需要出示個人的基本信息,而一旦是同意公開條款(例如註冊電商網站等),其已經同意個人信息使用權轉讓,且為無償使用;企業的數據所有權也很清新,其生產經營過程中積累、不涉及政府安全和個人隱私的數據,自然屬於他的數據,包括自己基於原始數據加工後的數據;政府的數據也比較清晰,根據國家的法律要求,個人、企業需要依法上報自身信息,也是義務,同時國家也有保護個人、企業隱私的職責。因此,數據的確權問題並不存在,你的就是你的,不是你的再怎麼拿也拿不過來。

估值和計價也不是問題,合規流通的數據價值計算遵從市場經濟調節,饅頭有公允的價格,但是對一個饑寒交迫的人和一個酒足飯飽的人價值本來就不一樣,根本不需要瞎操那份心去說明一條數據的價值---賣給不需要的人等於信息垃圾,賣高了自然也沒人要。至於是按條計價還是按數據包計價,計價多少,則完全按市場決定。至於為何估值和計價被頻繁的提起,裡面主要牽扯一類數據---政府掌握的數據,這類數據比較尷尬,信息公開滿足不了社會運行發展的需求,不開放出去,就形不成數據迴路,難以降低社會運行成本(各部門溝通成本高、社會管理效率低、產業發展有阻力...),但開放就比較尷尬,除了安全、隱私的問題,政府作為服務單位,應無償向社會公開,出賣數據國家不允許,但開放、運營又需要成本,估值計價問題大,而一旦收費又有利益尋租的嫌疑,需要多方面平衡。儘管如此,但也並非無葯可解,通常的做法就是收取運營的成本費用。

最後是交易平台的問題,交易平台的存在最大的意義是提供信任擔保,促進交易的快速高效進行,我們可以面對面,也可以遠程打款,有一個高可信賴、高易用性的數據交易網站再好不過。

問題二,目前來看數據交易現在的關鍵問題是什麼?

數據的交易和流通本已很成熟,關鍵的問題是如何規模化擴大。在我看來,目前數據交易的關鍵問題既不是不知道數據屬於誰,也不是算不清數據的價格,而是沒有足夠可以流通、交易的數據。這是一個供需嚴重不匹配的市場!其原因在於一是數據收集難度大,散落在各處,例如我們想找下全國生豬的存欄量;二是收集整理成本高,例如統計全國飯店的銷售額及客流量;三是加工難度高,不便於處理。這其中還包括我們信息化建設過程中形成的各種數據孤島,雖然數據已格式化存儲,但是沒能標準化釋放出來。全國各地一片大數據交易,但是突然發現市場還在培育中,沒有足夠的數據商品可以交易,好尷尬!

另一個關鍵問題是數據污染問題。數據污染是指原始數據遭到破壞,一種情況是原始數據傳輸過程中惡意加入污染數據(例如數據黑市中為增加利益收入,在源數據包中摻雜無用、假的數據),另一種情況是我們在做數據過程中無意識的數據破壞,包括數據清洗、數據過濾以及數據分析中認為的干擾,原始數據如同純鐵一塊,我們加點碳就變成鋼,加點稀有金屬就變成特種鋼,如果我們一直拿著特種鋼對外賣,別人就很難做成普通的不鏽鋼杯。因此,對數據本身,大眾最希望能交易到的是無數據過濾、無人工干預和抽樣的全數據,有了好食材再有好的廚師才能做出一桌好菜。

問題三,未來的大數據交易形態是什麼樣?

雖然數據生產困難,產品又魚龍混雜,但這只是數據流通過程中出現的一些問題,並不是不能解決。隨著大數據產業逐漸發展,行業應用逐漸豐富,人們逐步重視數據的採集和整理,大量數據的產品化將逐漸不再是是問題。不同於傳統的生產企業,數據的增值性要求高,會有大批量的數據生產公司存在,他們或專註於數據收集與整理,或專註於數據某一專業領域服務,無論如何,擁有數據成為其對外提供服務的根本。同時,也會出現幾個大型的數據交易網站,解決數據流通過程中供需信息不對稱的問題。

特別說明,本文只代表個人觀點,與作者本人所在公司無關。如需轉載請聯繫作者本人。
推薦閱讀:

「數據摺疊」:人工智慧背後的人工
原來電影數據可以這麼玩 - 第一彈:賣座電影最青睞的海報色調
安客誠成為阿里數據銀行首批認證服務商 助力數據營銷新生態

TAG:大數據 | 數據 | 數據可視化 |