有了這些創意美學,城市數據的趣味性超乎你的想像
你訪問過政府開放數據網站嗎?雖然開放的數據越來越多,但「可用性有待改善」仍是不少公眾對這類網站的共同看法。如何才能讓開放數據更好用,並打通公共數據到普通公眾的「最後一公里」?通過可視化讓數據變有趣,或許是解決方法之一。在1月3日的數據俠線上實驗室中,DT君邀請到上海大學美術學院信息交互設計工作室的李謙升老師,為大家帶來了來自美術學院的解決方案。
▍「有意義」的可視化和「有意思」的可視化
今天我們討論的話題是「可視化酷玩法——如何讓城市公共數據更有趣」。這個標題是DT財經方面起的,我覺得特別貼合我今天想講的內容。
我的內容分享主要分成兩個部分:一是數據可視化,我們作為2017年上海開放數據創新應用大賽(SODA)中的一支來自美術學院的參賽隊伍,最擅長的就是數據的可視化,包括交互設計。
在這個部分,我會結合我們的參賽作品和案例,看看城市公共數據的新玩法。
第二個部分,是分享我們上海大學美術學院信息交互設計工作室在可視化方面的其他一些創新做法,以及我個人對數據可視化的一些感想。
在進入第一部分內容之前,我想先通過兩個例子,讓大家有所思考:我們做可視化,是為了有意義,還是有意思?
第一個例子是杭州城市交通的可視化。通過智慧交通的可視化大屏,展現了很多有用的信息,圖表形式上也非常豐富,這其實就是一種很有意義的可視化方式。
第二個例子則是這樣的:有兩位設計師,一位住在倫敦,一位住在紐約。他們每個星期都會幹同一件事情,就是把每個星期生活中的一些小事都用數據記錄下來,比如笑了多少次,吃了多少次飯等,都是些雞毛蒜皮的小事。然後,他們會將這些數據繪成漂亮的明信片,寄給對方。明信片的正面是一幅非常漂亮的可視化圖表,背面則是關於這個圖的一些解釋。這個項目持續了一年時間。這種其實就屬於有意思的可視化。
什麼時候需要有意義?什麼時候又需要有意思?
這是個很有意思的問題。在我看來,當你的可視化是需要面向大眾的時候,有意思就顯得更加重要。而當你的受眾比較窄的時候,比如在某位老總的辦公室中放一塊可視化的大屏,他需要的可能就不是那麼有意思的東西,而是要有直接的信息。
回到我們今天的第一部分內容,如何才能讓城市公共數據更有趣。當我們把政府開放數據網站上的數據下載下來之後,會發現這些數據的格式主要是Excel、CSV等,這樣的文件,除了程序員或數據分析師等專業人士之外,對普通人而言,並不太好用。有什麼改進方法嗎?當然有。
▍用「有意思」的可視化打通民眾和公共數據的通道
城市公共數據「難用」,這是我們去年參加SODA大賽想要去解決的主要問題。從我們美術專業的角度來看這個問題,解決的方法在於可視化。
通過數據可視化,我們能夠幫公眾和公共數據之間建立一個通道,讓民眾可以方便、簡單地去使用開放數據,去「把玩」、探索,從而讓這些公共數據的價值能夠發揮出來。
我們為此專門建立了一個叫做「DataSH」的網站,希望能對城市公共數據進行可視化的集中探索。這個網站實現了三大功能:
第一塊是數據探索。我們設計了十種最基本的圖表,可以讓用戶很方便地從時間、空間的維度,來從不同的角度對公共數據進行探索。圖表部分,我們是基於百度Echarts來做的,因為Echarts的數據表封裝已經非常好了,我們只需要按照其數據介面,往其中填數據即可。
第二個功能則是城市數據故事。在這個部分,我們會對一些有意思的公共數據進行可視化,然後再配合文字,做一些數據故事的專題,將數據融入故事,大眾也更有意願去讀、去看。
舉個具體例子。下圖是上海地質資料信息共享平台的網站。在這個平台上,開放了很多地質有關的數據,其中有一個很有意思的數據是關於上海市地面沉降的。大家都知道上海這座城市的地面每年都在往下沉。但一般人並不會到這個平台上來專門看相關數據。為此,我們做了一個互動的可視化作品。
反映的是從1921年到2010年間,每隔10年,上海的地面沉降的狀況。從圖表中可以看出上海的地面是如何沉降的,還包括沉降速度。
從中我們能夠觀察到很多現象:比如在60年代以前,上海市的沉降範圍很小,但是沉降的速度很快。圖中越紅的地方,就代表沉降速度越快。而到了60年代之後,城市每年都在不斷對外擴大,但是沉降的速度是放慢的。如果你仔細觀察,還可以去具體分析哪個地方沉降比較嚴重等等。
另外一個例子,是我們做的上海市古樹名木地圖。一般樹齡在100年以上的樹木都稱之為古樹,上海市有不少古樹名木,大概有二、三千棵,分布在上海的各個地區。這樣的數據政府也公布了。這些數據的格式當然也是Excel,對於普通人來說,這樣的二、三千條數據,對他們並無太大的意義。
我們將這些古樹的數據同樣做成了一個互動的網站。下圖是網站的部分截圖,在圖中,我們通過不同的顏色、圓圈大小來表明古樹的生長狀態(瀕危、生長良好等)、所在地區(外環外、內中環、中外環、內環內等)、樹種、樹齡等。
比如,上海市有好幾棵千年銀杏,代表樹齡的圓圈就特別大。在這個網站上,用戶可以進行互動,通過選擇菜單、切換不同的模式,獲得不同的視覺效果。
通過這樣做,我們希望能將這些數據做得更有意思、更簡單、更清楚,民眾也更願意去看、去玩這些數據。
民眾喜歡什麼樣的數據?我覺得廣東佛山南海區的做法值得借鑒。他們曾經統計過數據開放網站最受歡迎(下載量最高)的數據類型,能夠看出哪些數據是熱點數據、哪些更受歡迎。我覺得上海市的政府數據開放平台也可以做這樣的事情,可以看市民對哪些開放數據最有興趣、有迫切需要。
第三個功能則是數據工具。我們希望將我們的作品再提高一個層次,除了用可視化把這些數據的價值體現出來之外,我們還希望利用數據工具來輔助公眾做出決策。在這個部分,我們目前正在努力去設計一套好的工具。而其實在國外,已經有了先例。比如,《紐約時報》在2013年做了一個案例,我覺得特別符合我對數據工具的期待:
在這個例子中,圖的左邊是當地的一些關於房屋的數據,你輸進去一些數字,比如房價、房貸利率、要在這個城市待多久等,輸入之後,右邊就會顯出一個數字。這個數字可以提供參考,到底在當地租房合適還是買房更合適。這個工具特別簡單又易用,可以輔助民眾去進行判斷、決策。
▍有意思的可視化,不一定要在「紙上」
我在開頭也提到了,對公眾而言,我覺得「有意思」是可視化當中非常重要的要素。特別是當你面對的是普通公眾的時候,那麼有意思就顯得更加的重要。
對於做可視化的人來說,你可能需要掌握一些可視化的基本知識,比如你需要按照人眼對各種圖形的敏感度去選擇圖形,或者需要基於不同類型的數據去選擇圖形。這是可視化的基本原理。
但是如果你完全按照上面的這些規則去做,做出來的可視化可能就會顯得沒有意思。
多年以來,不少人都總結出相關的經驗與方法論,比如何時使用柱狀圖,何時用曲線圖、餅圖等等,按照這一套做法去做,你會把數據表現得很清楚,但是卻缺少了趣味。
同樣是公共數據,我們能不能找到一些新的辦法、新的材質、新的形式去表現它,讓它顯得更有趣呢。我們在這方面做了一些嘗試。
下圖是我們之前做的一次展覽的實驗,就如圖上可以看到的,比如上海市消防局的分布,我們沒有用簡單的圖形來表示,而是用實體的管子的方式。當然我們會生成一個沃羅諾伊圖代表某個消防局的覆蓋範圍,這同樣也是一種可視化。普通的大眾看到這個東西,也特別容易理解。
類似的例子還有停車場。我們從政府開放數據網站上下載了全上海市停車場的分布數據,比如它們每個小時的收費價格(3元/小時、4元/小時等,最高為11元/小時。)
對於這樣的數據,我們也可以用模型、沙盤的形式呈現出來。從下面這個圖上,你就同樣能直觀看出不同價格的停車場的分布情況。
另外,前面提到的古樹名木,我們也有新的做法,我們用一根線代表10棵古樹,然後用了一個瀑布圖的形式。每根繩子對應著自己的屬性。這樣做,儘管可能沒有柱狀圖、餅圖表現得那麼清晰,但是形式上卻相對有趣。
之前我們在做展覽的時候,就會發現,很多人對數據本身並沒有興趣,但是他們覺得形式上很有意思,特別容易接受。這也讓我們覺得,我們的不同做法,在可視化方面給觀眾也是有哪怕一絲的作用的。
不僅僅是城市數據,其實我們也關注其他有意思的數據。
我跟大家分享另一個案例,這也是我們前不久為一個展覽做的。背景是這樣的:我們所在的學院為手工藝人開辦了一個培訓班,學員的背景、姓名、男女比例等數據,都記錄在了Excel表格中。這其實還是比較簡單的,但我們最後做成了一個照片牆的形式:將這些無趣枯燥的數據展示出來。
當這些學員看到這個作品時候,都覺得很有趣,首先他們會被自己的照片吸引,然後還可以看到屏幕中的其他圖形,比如,他可以了解到學員中學刺繡的有多少、哪些人喜歡羌綉等等。
另一個例子,則是藏傳佛教裡面的唐卡。對於佛教中的人物形象,在畫唐卡時是有嚴格的比例尺寸的。這套標準的背後其實是一些簡單的數學比例關係,我們對此也做了一個互動的可視化網站:
網站上的互動操作也很簡單,用戶可以自己去拉動不同的比例線,右邊的數字就代表你拖動的這個比例是不是符合金屬上的比例。如果是100%就意味著完全符合,而數字越低就意味著越不符合標準的比例。
另外,我們還嘗試了用感測器來收集一些有意思的數據。比如寫毛筆字。感測器會記錄你畫東西、做手工藝時候的肌肉變化等。我們希望能夠通過數據的方式,把這些手工藝的技法給保存下來。
除了用圖形去做可視化,我們也在想能不能用機械的方式、不同的材質去做可視化。比如說,我們可以用機器來控制磁流體,讓磁流體變成不同的形狀。
為了實現這樣的效果,我們做了一個機器的矩陣,來控制前面的磁流體。下圖就是我們背後那個機器原型的樣子:
類似的實驗,我們做了很多。
怎麼樣從數據到圖形,這背後其實涉及到很多技術手段。對於今後,我們希望能夠用新的方法、技術和形式來獲取數據、表現數據之外,也能夠更多去探索數據背後的秘密。
註:以上內容根據李謙升在數據俠線上實驗室的演講實錄整理,有刪減及部分調整,已經本人審閱。本文僅為作者觀點,不代表DT財經立場。
DT君送福利:
本文所有圖片均來自作者PPT,可在後台回復「上大美院」獲取完整版。
作者 | 李謙升
編輯 | 胡世龍 : hushilong@dtcj.com
題圖 | 視覺中國
期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。
▍數據俠門派
本文數據俠李謙升,上海大學美術學院教師,2017年SODA大賽「未來之星」獎獲獎團隊「SHU_VIZ_GROUP」隊長。主要研究興趣在數據可視化、信息交互設計等。
▍加入數據俠
「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。
http://weixin.qq.com/r/qTkRCcbEKZtWrYJq92y7 (二維碼自動識別)
推薦閱讀:
※MATLAB數據可視化[1]:geobubble
※leaflet在線地圖進階寶典之——高級輔助特性
※DataHunter:數據可視化,打通產業鏈最後一公里
※我們為什麼要做數據可視化?數據可視化的真善美是什麼?
※【深入淺出數據可視化 01】關於入門這件小事兒