關於開放數據:上海是中國第1,而中國是世界第71

文/程一祥

2017年貴陽「數博會」上最新發布的《中國地方政府數據開放平台報告》顯示,近年來,雖然各地政府日益強調開放數據的重要性,但總體上,全國範圍內,真正做到開放數據的仍是少數地區。而這些地區,在分布上也存在著極不均衡的狀況。

2017中國城市「數據開放」指數:上海第一,貴陽第二

隨著「開源」思想在互聯網領域的蔓延,這幾年,全球越來越多人開始呼籲政府和企業「開放數據」。對數據開放的需求,這在大數據時代表現地尤為迫切。

作為全球互聯網大潮的前沿陣地之一,中國政府相關的數據開放情況也一直受到關注。

5月27日,由復旦大學數字與移動治理實驗室出品,復旦大學和提升政府治理能力大數據應用技術國家工程實驗室聯合發布了2017年《中國地方政府數據開放平台報告》(簡稱《報告》)。報告評估了國內19個城市的數據開放平台,並建立了一套「開放數林」指標評估體系。在最終的榜單上,上海市奪得頭把交椅,貴陽緊隨其後,排第三的則是青島,但是青島與上海和貴陽已經有較明顯的差距。

在解讀這份榜單之前,我們首先要了解什麼是開放政府數據?

國際上普遍認為,開放政府數據應符合8大基本原則:完整、原始、及時、可公開獲取、可機器讀取、非歧視獲取、非專屬以及免於授權許可。簡單來說,就是任何人可以憑藉任何目的免費地使用、修改、分享的數據。

2017年,國務院辦公廳印發的《政務信息系統整合共享實施方案》也指出,要向社會開放「政府部門和公共企事業單位的原始性、可機器讀取、可供社會化再利用的數據集」。在對待開放數據的定義上,中國與國際社會的標準總體是一致的。

上述《報告》也基於這些大原則,按照更細化的指標要求,對入圍的19個城市的開放數據平台進行了「開放數林」指數評分。接下來就讓DT君具體帶大家看看,中國各地市的數據開放情況究竟如何?

中國地方政府開放數據:平台較少,但數據豐富程度尚可

從整體上看,中國地方政府開放數據的建設與國家政策有著密切聯繫。

2012年,上海市首先推出了中國大陸地區第一個開放數據平台。但全國其他地區的開放數據平台的增長速度卻一直較為緩慢。直到2015年國務院印發了《促進大數據發展行動綱要》,各地數據開放的速度才明顯加快。浙江、貴州、廣東等地方陸續上線了開放數據平台。

另一方面,對於已經開放的數據,各地平台對於元數據的提供還是比較友好的。(DT君註:元數據為描述性數據,主要說明數據的屬性信息。有助於數據利用這更了解數據集的內容和背景,從而更好地獲取和利用數據。)

目前,國內大多數平台已經能提供數據描述、主題、關鍵字等元數據信息,雖然更新頻率、訪問量、數據項等信息較少,但是從屬性上看,數據的豐富程度還是值得肯定的。

想用開放數據創業?你還應該注意這些「坑」

全球最大的開放數據NGO「開放知識基金」認為,政府開放數據的價值,不僅在於促進政務信息透明和市民的參政議政,還在於創造社會和經濟價值。DT君也看到,不少科技創新型企業是利用政府開放數據作為商業活動的載體。在北京冬天霧霾最嚴重的日子,DT君也曾經想過創業,如果能把政府開放的天氣數據和體育結合起來,說不定能做一個「霾都跑步指南」呢。

作為政府開放數據的使用者,DT君最擔心的,是開放數據的數量、質量和可持續性。

首先是數量。《報告》顯示,各地平台上開放的數據集數量尚可,但即便如此,各城市之間的差異仍然非常明顯。

雖然上海是綜合指數最高的城市,但是如果僅從數據集總量上看,武漢以1297的數量力壓上海和貴陽,名列第一。不過另一方面,各地的差異也非常大,最少的湛江只有29個數據集,連第一名武漢的零頭都不到。

其次是質量。

比起清潔度、真實性等細節的數據質量問題,DT君更關心的是政府開放數據的法律保障。

理論上,開放數據應該通過開放授權協議從法律上保障數據的開放性。協議內容應明確授予用戶免費獲取、不受歧視、自由利用、自由傳播分享的權利。但是目前國內的19個開放平台,沒有一個平台的協議全部明確授予了上述四項權利。

看來,企業在利用政府開放數據的時候,可能要考慮更多的政策性風險。

最後是可持續性。不更新的開放數據都是耍流氓。

對於大數據產業來說,迭代速度是另一個非常重要的指標。DT君如果要做那個霾都的項目,沒有實時更新的數據是註定做不成的。那麼中國這些地方政府的開放數據平台,表現如何呢?

上海不愧為綜合排名第一的開放數據平台。其上線時間最早,持續性也最好,至今已經保持了連續9個時段的持續增長了。北京緊隨其後,持續增長時段為6個。湛江的表現依舊墊底,自從2014年上線後,便不再新增數據集。如果你用湛江的開放數據創業,可能此時就要喝西北風了。

總的來說,2015年後新上線的開放平台,基本都能保持數據集的增長,整體形勢是趨向好的一面發展。

上海這麼牛,中國整體怎麼樣呢?

從上面這些指標看來,把上海稱為中國開放數據第一城,還是很有道理的。但如果我們把目光放到國際上,中國整體的政府開放數據水平怎麼樣呢?

由互聯網之父蒂姆·伯納斯·李(Tim Berners-Lee)創辦的萬維網基金會(World Wide Web Foundation)公布了最新一期的「開放數據晴雨表」(Open Data Barometer)全球報告。報告比較了全球各個國家的政府開放數據情況。

在納入評價的114個國家和地區中,英國在「開放數據」上得分居首,加拿大、法國、美國、韓國緊隨其後。榜單中排在前列的多數是歐美國家,亞洲國家中韓國、日本表現出色,都擠入了前十的位置。

中國只排在了71位,比上一年度下降了15個名次。雖然上海在國內表現出色,但是中國總體上各類型的數據開放程度和質量,在國際上依然處於落後的狀態。中國到底哪些類型的政府數據沒有開放得很好,導致得分偏低呢?

數據顯示,中國只在人口數據開放方面做得相對較好(65%),其他方面全部乏善可陳,各類數據的質量都在5%或15%之間。選舉數據是開放數據中表現最不好的項目,數據質量為0%。

其實,「開放數據」這個詞,如果把它看做一個人,也不過只有不到20歲的年紀。它血氣方剛,正在蓬勃生長,但同時又經驗不足,經常犯錯。中國在政府開放數據的探索中,也是一樣。我們能夠看到諸如上海這種,有戰略、有計劃、漸進型的開放模式榜樣,也看到了國內不同地區開放數據質量分布的不均。

獨木不成林,要建設中國的開放數據,還需要更多的「上海」和「貴陽」,一座城市開放數據形成示範效應,帶動更多城市加入,最終形成開放數據的森林,提升中國整體的開放數據水平。

備註

本文部分參考自報告《中國地方政府數據開放平台報告》。該報告由復旦大學和提升政府治理能力大數據應用技術國家工程實驗室聯合發布。「開放數林」指數由復旦大學數字與移動治理實驗室出品。

更多精彩內容,請關注DT財經微信公號(ID:dtcaijing)。


推薦閱讀:

貴陽旅遊攻略 | 天河潭1日游(1期景區)
貴陽這座城市
西江千戶苗寨內view好旅店客棧?
有什麼關於貴陽的冷知識?

TAG:开放数据 | 上海 | 贵阳 |