政府的數據公開有哪些商業價值?


LZ的提問可以進一步明確為:」政府有哪些數據「「那些政府數據可以公開-開放」,「這些開放的政府數據如何創造商業價值」:

政府有哪些數據?
美國政府與索馬利亞政府所擁有的數據資源毫無疑問不在一個量級上,一般來講,一個政府如果要能沉澱 一大批可供應用數據,是以政府的業務進行信息化為條件的。以下基本以中國為基準進行探討。

1) 企業和組織
主體基礎數據——比如工商數據,組織機構代碼數據,相關主管部門的審批,備案(工商、民政)——有關於這個組織降生的信息;
主體業務相關數據——比如納稅數據、財務數據(雖然不是那麼準確,但也不是全無意義),企業從事業務相關的資質(比如餐廳的衛生評級,比如從事保密業務要有保密資質,從事基金要在基金業協會備案),進出口的情況在海關有數據,給員工發工資要有社保的數據;
主體其他數據——比如訴訟記錄,比如參加政府的扶持項目,創業比賽創新基金的申報資料,被處罰的記錄,等等

2)個人
個人基礎信息——比如身份證信息
個人認證信息——比如各種學歷、資質(一部分資質在一些協會單位,但其實也類似政府)
個人的行為痕迹——比如上網、通話、行動的一些記錄,某些安全部門是有的
個人的財產——比如房屋車輛所有權
個人的金融情況——比如人行有所有發生過銀行的人的徵信記錄
其他所有——我恐怕想不出來有什麼數據如果強力部門需要,但因為技術水平得不到。。。

3)環境
山川海洋土壤大氣——地理信息、環保、野生動物

4)政府本身業務數據
政府各項審批、監管留存的數據(工商、專利、司法、公安、醫療等等)
政府因為業務本身所需要以數據形式存在的一些行為,比如政府預算,政府的財政撥款等等。

哪些數據可以開放-公開?
首先,開放數據和公開數據不同,如下圖

(數據來源:高豐先生演講《數據開放概覽》)

所以廣義的說,可以商業應用的未必是開放數據,而是機構和組織「可接觸到」的數據,比如一些政府數據不可能人人訪問,但為了特定目的,可以授權一些企業分析使用,從而得出這些企業的客戶所需要的結論。

其次,政府——尤其是信息化的大政府雖然沉澱了大量的數據寶藏,但這些寶藏不能人人去挖,也不能把這些寶藏直接扔在露天。
第一、是公民隱私問題,比如身份證數據肯定有巨大商業價值,但如果公開了,那將給大家的生活和財產安全造成巨大的問題。
第二、企業的商業秘密問題,比如海關數據,如果開放到企業每一單進出口詳細情況,那企業的成本或售價就公之於眾,商業秘密不復存在
第三,政府的技術、意願和能力問題,很多數據雖然存在,但在什麼程度上開放、公開或共享目前尚無明確的路線,另外很多地方數據,如果進行匯總,需要在系統、技術、數據分析、開放平台的巨大投入。

「政府的數據公開有哪些商業價值?」問這個問題,首先要問,政府能公開哪些數據。

但這個問題並不好回答,因為既沒有明確的尺度,政府能公開什麼,也沒有明確的優先順序,為什麼A數據就該優先於B數據公開。

目前來看,涉及到普通公民的具體信息肯定是一條紅線,不能開放,如果要進行應用,比如說徵信,也需要有相關人員的明確授權,比如你申請信用卡時,就授權銀行調取相關相關信息。

目前能公開、開放的,主要是一些統計結果,比如以前在做一個鐵路的項目時,鐵道部網站上有歷年鐵路發展的情況(比如鐵路里程、客貨運量、機車-車廂數量等),另外在環境數據,比如氣象數據,國家氣象局也做了開放。

這些開放的政府數據如何創造商業價值

「政府能公開哪些數據」或「政府將公開哪些數據」這個問題是懸而未決的,所以「開放的政府數據如何創造商業價值」 也是要逐步摸索的。

但做數據分析不是直接簡單粗暴的吧數據拿來用,比如知道了大家的電話號碼,進行「精準營銷」。數據分析應用最美妙的部分是結合應用場景,通過數據的整理、融合、分析,創造新的商業模式,改善用戶體驗。

比如,最簡單的,從可視化層面,前一段時間熱議的地鐵圖樣式的高鐵的地圖,大大方便了大家的出行。其實高鐵哪裡有站是公開的,但是如果用顏色、圓點這樣的元素進行可視化,大家的體驗完全不一樣。

另外,最近出現的幾個查詢企業信用的App,比如「企查查」、「企+」等就是應用政府開放的工商數據,通過移動互聯網為用戶提供淺信用服務。用戶只需要掃一掃對方的名片,就可以了解對方企業的基本信息,如果對方吹牛說自己實力如何雄厚,買賣做的如何大,你一查,這個公司只有十萬註冊資本,那就可以進一步了解一下。。。

還有,比如目前常用的「航旅縱橫」、「飛常准」等 App,就是用了民航航班數據,為大家預測準點率,結合大家的乘機人數據,為大家辦理值機等等。有的航空延誤險,也可以通過乘機人數據的自動對接,做到快速承保和自動化理賠。

另外美國的Climate Corporation(10億美元賣給孟山都了),也是用天氣數據預測農業產量,進而預測災害發生概率,從而向農戶銷售保險。

數據行業是個苦差事,先積累後應用,和流行的「互聯網思維」相反(先應用,後積累),所以數據行業慢公司比較多。

中國政府數據即使大幅度開放,其實也只是豐富的大家炒菜的原料,真正能做出好菜,一方面還是要吃過見過多琢磨,另一方面還是要勤學苦練踏踏實實。把原料洗吧洗吧直接買,最多只能在做幾個冷盤。

目前國內比較有趣的幾個數據公司,也基本是要融合多個數據源,有自己的一套加工分析整理應用的方法。所以,政府數據即使開放,相信最終也是融入到各個數據企業或數據化企業的系統與場景中,作為一個新增加的維度,進行分析與應用。

如果沒有深度的用戶理解和數據理解,即使政府數據開放了,恐怕也難有作為。正所謂,機會只留給有準備的人。


原答案抖機靈了,還是說幾句。
首先比較同意一樓的,要先確定「政府是要公開什麼數據?」可理解為數據的類型。
另外還有:
1.公開數據的範圍
2.公開數據的準確性
3.公開數據的使用限定
這些內容都會對數據的質量以及使用價值大打折扣。
一般公開的數據會是從大方面的數據開始,比如(我猜)
1.人口的各個地區基本屬性:年齡,學歷,男女等(有人說已經有了?準確?詳細嗎?)
2.人口的各個地區行為數據:用電,用水,消費等
3.人口的各個地區流動數據:坐動車,坐飛機,辦理各種證件等
。。。

有了這些數據,基本可以套用我們一般的分析模型去理解公開的這些數據的價值:
那就是市場規模,市場趨勢的預測更有效,具體某個項目投資回報率的預估會變得更準確,有眼界的人做出更靠譜的事。

總之,沒有數據難以了解較為真實的情況,還是保留那句話:
--------------------------------------------------------------
有什麼比扯開衣服看的更真實?
這就是價值


人口統計最值錢


英國警署把區域犯罪率信息公開,當我們把各地區房價與犯罪率做相關性,得出結論是犯罪率越低的區域房價越高。
荷蘭超市把食品的營養元素含量公開,方便大眾準確監測營養元素攝入量。


先佔坑

大家一定要對標英國哈,英國是這方面最成熟沒有之一的,加之英國統計應用之強大讓答主我時常下巴掉地下。


最近比較忙,看到大家的長篇大論,我是來潑冷水的!
之前去談客戶,我說我們能夠拿到XX信息中心的數據,這些數據是政府數據。
結果人家直接回了句:我以為這些數據是你們爬取或者是交換來的。他說,你們是做大數據的,你們相信政府數據么?這些都是水分堆砌起來的,沒什麼價值!
一些有價值的數據往往會涉密,或是一定程度上被清洗了!所以我還是比較認同客戶的這個說法。所以,即使政府開放了數據,能發揮的價值還是相對有限。


政府的數據可以用來便民嚮導透明化的服務


公開空氣污染數據,精確到每一種污染物,每分鐘的平均值,這樣可以指導人們的戶外運動和疾病防治。


推薦閱讀:

想轉專業機器學習(人工智慧)需要學哪些課程?
為什麼《英雄聯盟》有這麼多玩家?
Python2和Python3哪個更適合初學者學習來爬蟲呢?
2016 年美國大選的投票結果中,有哪些數據值得分析?
如何高效地學好 R?

TAG:數據挖掘 | 商業 | 商業價值 | 數據分析 | 政府 |