標籤:

你最欣賞的數據可視化的案例是什麼?

不管是新媒體還是傳統媒體,數據可視化成了一個趨勢與方向。但是從現在看到的作品,有很多卻讓信息變得更加負責、模糊和不易讀。那麼你看過的數據可視化案例中,覺得最值得讚美的是哪個?請附圖。對了,有沒有專門收集數據可視化優秀案例的網站?

謝謝。


致我們那顆嗜圖如命的大腦袋:談談數據視覺化

這兩天利用了一些「碎片化的時間」(我就不透露碎片的細節了,反正挺碎的),讀了耶魯教授 Edward Tufte的小冊子 The Visual Display of Quantitative Information (《圖表設計的現代主義革命》),感覺搞金融投資的平常難免與大量的數據和圖表相愛相殺,分享一些讀書心得給大家開開腦洞,內容很輕鬆。

首先我們先要下一個重要的結論,人類的大腦嗜圖如命,但其實對數據很無感。舉例來說,我給你報出某個正妹的臉部及身體各部分各器官的精確參數——RGB顏色值啊三維坐標啊長寬高啊之類——讓你擼,你能邊看這些數字邊擼嗎?

所以好的數據視覺化過程會將我們對數據的無感轉化為我們對圖像的有感。一個很有意思的例子就是安斯庫姆四重奏(Anscombe"s quartet)。

來源:維基百科(圖二與圖三同)

上面是一二三四 四組數據,每一組數據都包括了11個 XY坐標軸上的點。比如第一組數據包括了(x=10,y=8.04)、(x=8,y=6.95)、…、(x=5, y=5.68)十一個點。首先大家一看這些數據肯定懵逼,這很自然,把一大堆數據赤裸裸地餵給你,我們的腦子是不吃的。但是沒關係,睿智的統計學家們這個時候會扛著一把大尺子進來,然後告訴你這四組數據統統展現出如下的性質:

於是你一看卧槽,這些數據表現的關鍵統計量都一模一樣啊,那這幾組哥們妥妥的都是差不多的數據嘛。大家都共享同一個回歸線性方程(y=3.00+0.5x),如同遠去的列車穿梭而過那一片寧靜的霓虹啊。同一個世界,同一根歸線。

於是我們向統計學家致敬,並下了如此的結論:這幾組數據都是一樣的。

而事實上,如果我們把這幾個點在坐標軸上畫出來......

......你就會發現生活欺騙了你。

這個生動的例子說明,在這個連賣個粽子剃個頭都要講大數據的時代,很多數據必須要用視覺化的方式呈現,不然你根本把握不住這些數據的意義,哪怕我把所有的統計量都給你算出來。

一張好圖是可以救命的,甚至可以普度蒼生。

1854年倫敦爆發霍亂,短時間內數百人因之喪命。那時候人們其實並不知道霍亂的傳播機理,沒有細菌的概念,還以為霍亂乃是吸霾所致;那既然是吸霾,就只能聽天由命。有一個叫John Snow的醫生開始對吸霾論表示懷疑,他認為更大的可能是水裡有毒。然後 Snow 醫生就明察暗訪,收集了大量死者的死亡位置數據,並發揚了數據視覺化的精神,把所有的點數據都投射到倫敦的地圖之上;另外他把倫敦的七個主要水泵的位置也用「X」標了上去。

來源:The Visual Display of Quantitative Information

數據視覺化會讓一些原本撲朔迷離的關聯瞬間變得明如星漢。Snow醫生張開明亮的大眼睛這麼一瞅就發現,我去,同志們這陣亡得好有規律。基本上大量死者都是密布在城中心的寬街(Broad Street)周圍,而寬街上正好有一個方圓 X 里以內唯一的水泵。洞悉真相的Snow醫生趕緊通知政府關掉了那個水泵,疫情立馬就停了,萬千蒼生得以倖免。

當然你也可以把這些點數據用經緯度量化出來,再編一個鬼知道長什麼樣子的程序去運算,再加一點運氣最後你可能也還是能把那個水泵給算出來;但是在這個例子中,啥方法可能都不如將數據視覺化,然後通過我們嗜圖如命的大腦去解出最終的謎底。

---------------------------------------------那些壞圖的分割線------------------------------------------

然而也正是由於我們的大腦嗜圖如命,在投資和生活中我們一定要警惕那些充滿了惡意要來蒙你的壞圖。

首先古諺有云:「如果你吃進去垃圾,那麼你拉出來的必然也是垃圾」(garbage in garbage out)。所以無論你的視覺圖多麼婷婷裊裊,如果你的數據本身是垃圾或者別有用心,那麼出來的圖肯定也是垃圾或者別有用心。

以下是 1929 年紐約與倫敦股市的走勢圖,但是中間混進了一個奇怪的東西——太陽輻射熱量(solar radiation)。這張圖要傳遞的意思是太陽輻射導致了1929年股市的起伏與最終的大奔潰。當然明眼人一看就知道這是扯淡的,相關性不代表因果性(correlation does not imply causation)。所以當本身數據就有巨大缺陷時,你的圖肯定不善良。

來源:The Visual Display of Quantitative Information

但有的時候數據是好好的數據,卻被人惡意地用視覺化來呈現。舉幾個最常見的把你當成二傻子來蒙的壞圖典型吧。

一.

比如市面上有一個基金,叫小達基金,另外在業內還有小魑、小魅、小魍、小魎四個同風格同規模的基金,乃是小達基金的直接競爭對手。一年下來由於鴻運當頭, 小達基金當年收益率略壓群芳,這五個基金收益率分別是8.27%、 8.01%、 8.12%、 7.98% 和 8.07%。

然後小達基金的經理就叫手下去搞個宣傳材料,必須要在投資者報告里吹一波當年的表現,結果手下做了這麼一個圖表:

一看此圖經理龍顏大怒,這是啥傻逼玩意你要我怎麼吹?來人啊把這幫廢物拉出去斃了,順便再去請師爺。

師爺徐徐而來,他老人家搞了這麼一個圖表。

師爺大獲全勝。

惡圖蒙你第一招:Y坐標不從零開始,故意使差距戲劇化。

二.

經理想了想投資者報告上還要放一張基金規模對比圖。當時小達、小魑、小魅、小魍、小魎五個基金的規模分別是 2億、2.2億、1.9億、2.2億和2.1億,小達排名倒數第二,看起來不大理想。經理又喚來了剛剛槍斃過的那幾個廢物讓他們搞個餅圖,於是這幫廢物們就畫了這張很自然的大餅:

這張圖除了餅夠大以外實在乏善可陳,還有啥可說的,直接再斃了請師爺吧。師爺再次奉上傑作:

3D圖由於構圖使用透視法,近大遠小,因此在前面的內容哪怕本身數字不大,體積也會顯得很大。

惡圖蒙你第二招:以炫酷的3D圖來製造視覺假象(大家尤其要提防3D餅圖,此乃是製圖界的安然)。

三.

倚靠上面那兩張神圖,小達基金在投資者報告會上收穫了掌聲,在接下來的一年裡小達基金再接再厲,取得了-20% 的一塌糊塗的表現,而魑魅魍魎四對手當年分別斬獲了 11%,12%,13%,14%的收益率。這TM就很尷尬了,如果繼續讓那幫廢物做圖,一定會出現以下這副慘象:

但是我們有師爺智多星啊,來一招偷天換日。

如果你浮光掠影地一看,還以為小達基金當年獨領風騷,在同行一片蕭瑟的時候搞出了社會主義建設的新高度。但你仔細一看Y坐標從上而下的排列就要會心一笑。你可能要疑惑人會那麼傻不看數字只看圖嗎?我出於經驗主義的回答是:會的。如此的不利局面師爺都可以挽狂瀾於既倒,此處應當有掌聲。

另外這裡也體現了識別惡圖的一項原則:一個圖越花里胡哨,越有可能是企圖要掩蓋某一些原始的信息。

惡圖蒙你第三招:不按常理出牌,偷換既定的數據呈現規則。

四.

由於基金經理投資風格比較激進狂野,小達基金每年的表現呈現兩極分化,收益率變化也跟著非常狂野。

這樣投資者看到了歷史表現就會陡生狐疑:你這狀態好像有點不穩定啊,那我投資你的基金豈不是在押大小。所以狡猾的我們應該一下撕掉上面的圖,而讓土豪金主們看到下面這張:

惡圖蒙你第四招:擅變坐標刻度,呈現戲劇化(或極為平穩)的波動。

五.

我們假設小達基金洗心革面煥發了生機,終於開始不虧錢了,從2017年到2021年的五年中,每年的收益率分別為10%,8%,6%,4%,2%,雖然一直在賺錢,但是頹勢非常明顯。所以如果用一般的圖來表達,肯定讓人看了想死。

但如果用師爺親手特製的累積收益率(cumulative return)圖,一切看起來就將很美。

你會說卧槽這不是騙人嘛。但是其實人家已經清楚告訴你這個基金收益率是累積收益率啦,你仔細地看是能看出來的。

惡圖蒙你第五招:以累積增長替代增長,以試圖掩蓋增長頹勢的慘像。

六 .

終於到了202X年,風水輪流轉,絕境中的小達基金由於豪賭朝鮮主權債務違約成功 (其實基金表現一般都有一個均值回歸的趨勢),在該年一雪前恥揚眉吐氣地拿下了80%的收益,同年魑魅魍魎四弟兄收益率都不及5%,於是你想,這張圖太好辦啦,那幫廢物來搞就可以了。

但如果你覺這就夠好了,那未免有一些傻白甜。請看師爺的匠心修改:

惡圖蒙你第六招:故意將一維數據(比如收益率高低)轉換為二維圖像(比如一個財神),以不恰當的比例來突出自己與其他對比對象的差距(本來只是長度差別,現在變成了體積差別),造成視覺衝擊。

---------------------------------------------一張好圖的分割線------------------------------------------

那麼與這些惡圖相比,什麼樣的圖是好圖呢?

Edward Tufte教授認為,很簡單,好圖與好翻譯一樣,應該做到三個標準:信、達、雅。簡單地說就是 1. 真實地表達豐富的數據,避免扭曲數據(avoid distorting data);2. 目的清晰,發人深省,激發觀察者去比較不同的數據內容(serve a clear purpose and encourage the eye to compare);3. 有美感(aesthetic),當然與1和2相比,此標準居次席。

教授認為在人類歷史的長河中,有一張好圖真正達到了「一圖抵萬言」的至臻境界,一張好圖的信息量可以抵得上一本書,但閱讀她卻只需要花掉你噓噓的時間。

首先,這是一張難得的將空間與時間完美交織的時間地圖。你肯定見過很多時間序列圖(最常見的就是股價走勢圖),你也肯定見過很多地圖,但是把地圖放到時間序列上的奇葩,估計你這輩子見過的應該用一隻手都能數完。

此圖的作者是法國攻城獅Charles Minard,其描繪了拿破崙去俄羅斯的那一場宿命般的出差。1812年的這次御駕親征,拿破崙於六月領兵42萬人(史說61萬)入波蘭之境,越過最左邊的涅曼河,然後向東北方的莫斯科突突。俄軍一路堅壁清野,法軍一路非戰減員(飢餓與疾病),終於九月兵臨莫斯科,在距莫斯科一百多公里的博羅金諾村發生了激戰,雙方共傷亡66500人,史稱博羅金諾戰役,是人類戰爭史上最血腥的一天。

當法軍進入俄羅斯首都,莫斯科已然是一片焦土上的空城(聯想到二戰抵抗希特勒,老毛子自殘起來真的是挺捨得的)。結果大家都知道,十月來了 winter is coming,法軍凍成狗,咬咬牙只能撤。然後就是老毛子跟在法軍後面一路踹屁股,尤其是在別列津納河,炮兵一頓狂轟,頓時人間地獄。最後,拿破崙這邊不到一萬人(史說六萬人)逃出俄國。

這一張地圖上有六個變數: 法軍的規模、法軍的位置(橫縱兩個變數)、法軍的行軍路線、法軍撤軍的時間序列和法軍撤軍時的氣溫。

圖中米色的那一路是拿破崙的進軍路線,下方黑色的那一路是撤軍路線,而線條的寬度表示兵力多寡,我們可以看出拿破崙是如何粗大雄壯地入俄,然後纖細綿軟地出俄。從圖中我們可以看出那一些大戰役大減員,比如在別列津納河,本來僥倖會師的兩股法軍,瞬間又吃一記猛削,軍力驟然變細。

鐵棒磨成銹花針。

另外圖的下方標註了法軍撤退的時間序列,還有隨之相應的俄羅斯隆冬的氣溫(攝氏度)。通過觀看這張圖,我們可以想像出絕望無助的拿破崙軍隊在俄羅斯廣袤的冰原之上掙扎著咆哮嘶吼的窮途末路。請問,哪位歷史家或者小說家能夠在這麼幾個平方厘米上如此細膩地傳遞出如此豐富的信息?

面對這張神圖,Tufte教授只能感嘆:這TM應該是歷史上人類畫過最好的一張統計圖了。

利益披露:作者不持有文中提到的基金倉位。

本文行文倉莽,如有不足之處,還請各位海涵斧正。

轉載我是歡迎的,但請您署名陳達,在此謝過。


(最下有關於信息圖、信息可視化及可視分析的一個區分的觀點,歡迎討論)

首先,直奔主題,優秀的數據可視化案例很多,隨便給出幾個新的數據可視化的案例:

1)2014年世界盃期間,荷蘭隊對陣西班牙對的小組賽時間段內,荷蘭在twitter上發布的22萬條推的可視化。每個點代表一條推,點的大小代表被轉發(retweet)的次數。橫軸是時間,縱軸很有意思,代表每條推的激動的等級(level of excitement)。在這個設計中,激動的等級住要通過感嘆號的數目,以及大寫字母的數目決定。

2)歐洲體育電視台(Eurosport)製作的可視化網站,通過互動式可視化,對世界盃球員組成、球隊比較以及金球獎與球員的關係進行了可視化。網站地址:http://dataworldcup.eurosport.com

然後,推薦可視化的一些資源:

相關網站:

InfoVis:Wiki 信息可視化的一個維基百科網站,包括關於信息可視化的基本知識、可視化技術、軟體等。

visualcomplexity.com 和 Data Visualizations, Challenges, Community ,兩個數據可視化領域比較出名的網站,裡面有豐富的各種數據可視化的案例。

相關微信公共賬號:(專註可視化相關的微信公共賬號較少,大部分已不再更新,我們從裡面找出幾個還較活躍的)

@infovis 可視化之美,不定期更新各種可視化相關的知識,適合科研人員、碼農、設計師及可視化愛好者。@andyren介紹的拿破崙東征和蘭丁格爾玫瑰圖在這個賬號里都有介紹。世界盃期間還更新了很多世界盃相關的可視化。最近比較活躍,推薦關注。

http://weixin.qq.com/r/D0NfR4XE9diKrcEk9xYd (二維碼自動識別)

可視化圖匯,側重信息圖,不定期漢化翻譯一些信息圖。最近更新是六月。

可視化新聞,與可視化圖匯類似,不定期更新一些信息圖。最近更新是五月。

=====================================================

分享一個觀點,前幾天在微博上看到的可視化研究領域明星馬匡六教授的一張ppt,從數據規模角度對信息圖 、信息可視化 、可視分析進行了區分:

small size: infographics

medium size: information visualization

huge size: visual analytics

翻譯過來是:

小數據:信息圖

中等規模數據:信息可視化

大規模數據:可視分析

另外一師弟,在此基礎上給出了自己的觀點:

InfoGraphics: when you want to show some statistic analysis result. Visualization: when you want to show the facts. Visual Analysis: when you do not know which you want to show

翻譯過來是:

信息圖:展示一些靜態結果

可視化:呈現事實

可視分析:不知道要展示什麼

=====================================================

關於可視化對輔助理解的積極與消極的作用,可以參考這個回答:

數據可視化是讓信息易讀,還是更複雜?


數據可視化是一個歷史悠久的話題,並非因為最近大數據火了才出現。

本文簡單舉幾個例子,配以可視化的圖片,從而幫助理解可視化的歷史,重溫和展望經典。

1. 拿破崙東征俄羅斯,兵力變化圖,最初大軍出發,分了一小股軍隊後主力繼續前行,殺到莫斯科後折返,變成黑色線,與早期分兵匯合後返回法國。作為全面戰爭拿破崙玩家,看到這張圖真是心在滴血啊。

2. 弗洛倫斯·南丁格爾繪製的,此人是誰請自行查詢。該圖生動的體現了戰爭不同階段,人員死亡的原因。

3. 除了數據的圖表化,圖形的體現方式也是可視化的關鍵,我們經常看到的地鐵抽象圖,對比實際比例圖,會發現實際比例圖的城市核心區內容過於密集,導致信息不可視。

4. 數據中心溫度採集,數據中心可視化管理平台,同為3D界面,同為二維展示,前者羅列數據,後者溫度雲圖,實際應用起來,可以清楚的判斷熱點,設備新上架時方便規避。

5. IT邏輯可視化,業務應用圖、網路拓撲、物理設備在三維界面互聯互通,故障定位和業務影響分析的利器,比很多單層的IT管理軟體直觀很多,從而大幅提升效率。(傳說中工行IT在金融業的領先地位真不是蓋的)

最後總結一下,從古至今,可視化一直是存在的,數據可視化在如今IT和互聯網越來越發達的情況下火爆起來,對於人類認知和管理新世界,必定起到關鍵作用。


手錶——時間可視化,結繩記事——時間,事件可視化,你說這個算不算


超級大圖預警

數據新聞的話強推紐約時報和衛報,紐約時報更強一些。衛報發了兩篇報道講他們怎麼做好一篇數據新聞(How to be a data journalist和Data journalism at the Guardian: what is it and how do we do it?)。

XKCD上有時候也會給出一些比較有意思的可視化作品,比如xkcd: Movie Narrative Charts 和 xkcd: Congress。

這裡介紹一個我個人比較喜歡的可視化作品(談不上最欣賞吧,我個人很怕使用「最」字,感覺沒有餘地了……),是Twitter的一個數據可視化科學家Krist Wongsuphasawat對歐洲某個足球聯賽整個賽季縱覽的海報(見下圖)。粗粗看來就是對整個賽季賽程的概覽,哪些隊狹路相逢,到最終冠軍的歸屬。具體到每場比賽,有總比分,有Twitter數據反映的比賽激烈時段,進球時間。前面空餘空間不足,比較簡略,後面從半決賽開始有更詳細的兩隊主要球員的表現(同樣從Twitter數據反映)。

每個隊伍都有自己的特徵顏色,足球迷應該一眼就知道什麼顏色對應哪個隊伍,Twitter數據能夠很好地反映比賽進程的激烈程度。

更重要的是這張海報並沒有妄圖把所有信息都涵蓋進來,整體非常簡潔。很多時候設計師往往想要編碼很多內容,比如比賽關鍵詞、球隊戰術,反而讓作品很眼花繚亂。這張海報兼具美感和有效信息,我覺得這就是一個好的可視化作品(信息圖)應該做到的。


難道不是這個嗎


前幾天某日,凌晨五點多,被隔壁夫婦的周期運動吵醒。

錄音並可視化如下:

我知道聲音的可視化早就不新鮮了,不過我自己寫代碼做還是第一次,求輕拍。


看到的一個「音樂可視化」的案例:http://video.weibo.com/show?fid=1034:d8870ac2cddac34fa79f2d93a80f30db,酷炫炸天,想像無極限啊


這裡有很多可視化案例:Data Visualizations, Challenges, Community


我來安利一個數據地圖的可視化工具~

數據地圖在工作中的應用越來越多,老闆、銷售、市場、運營等人員做數據分析時,經常會涉及到地理坐標、區域和地名與數據關聯的情形,如某品牌全國代理商的分布及銷售額分布情況(銷售)、某個APP在全國各個城市的註冊用戶分布情況(運營)等。既然數據地圖這麼重要,掌握它也能帶來很大的價值,

一、何為數據地圖?

1.概念

數據地圖用來分析和展示與地理位置相關的數據,以圖示化的展現形式來呈現信息,使得這種數據表達方式更為明確和直觀,讓人一目了然,方便我們挖掘深層信息,更好的輔助決策。

2.常見地圖類型

1)中國省份地圖

有面積圖、氣泡圖兩種展示形式,很明確展示各區域數據,只要業務數據涉及到祖國的各區域,把企業各個省份的銷售額直接顯示在地圖上,把企業各地的連鎖店數量直接統計並在地圖上標明,那省份地圖一定對你很適用。

最重要的,地圖有鑽取的功能,可以點擊鑽取了解到不同地域的數據,例如:地區-城市-區縣(福建省—福州市—鼓樓區),多層鑽取可以幫助你逐層查看更細粒度的下層數據,這樣是業務數據很了解,有問題也能第一時間找到觸發問題的區域。

1969~2014年中國境內恐怖襲擊發生地區(面積圖)

2016年7月中國氣溫平均值高低分布(氣泡圖)

2)GIS地圖

GIS地圖比省份地圖更加智能,根據經緯度數據可具體定位到某個地點,不局限於只展示省份、城市的數據,數據更加精細。另外,只要有數據,BDP也可以展示國際地圖的,只是我手裡沒有國際數據,大家感興趣可以自己去做一張國際地圖,一定很酷炫。

  • 熱力圖:這個比較常見,一般按由深到淺的顏色來表示數據的從大到小、集中到稀疏

  • 散點圖

  • 點狀圖:單個地理坐標顯示為點,呈現點狀分布。

  • 地圖圖表:在地圖上顯示餅圖、柱狀圖、條形圖,瞬間感覺自己的地圖高大上

二、如何3步玩轉數據地圖

數據地圖的製作一般分為3個過程,即上傳數據—拖拽成圖—潤色完成,以BDP個人版為例。

  • 上傳數據

在儀錶盤右上方點擊「添加圖表」,選擇需要的地圖數據(可選擇多個工作表數據哦)

  • 拖拽成圖

先拖拽工作表至圖層,再拖拽經緯度、維度數值,然後選擇想要的地圖類型即可;

  • 地圖潤色

可設置顏色、尺寸,也可以對地圖進行放大縮小(滑鼠滑動即可),操作很簡單;做好的地圖能通過鏈接分享給好友,也可以直接分享到各大社區。

比如做工作總結、方案解說時,做好的地圖可以在BDP中全屏展示,當然你也可以把數據地圖導出為PPT中進行展示,這一定會讓報告增色不少。

三、數據地圖有什麼用呢?

我先跟大家分享一個案例!

某電商的BOSS想了解購買的用戶主要分布於全國的哪些地方,成交額主要集中在哪裡?這時候一張地圖可以很直觀的表達購買用戶主要集中在長三角和廣東、福建地區,成交額主要集中在北京、廣東和福建,這個數據可以幫助改變營銷策略:首先競價推廣上,廣東、福建地區一定要加大投放;其次,找出長三角(平均)購買用戶多但成交額不高的原因,是因為長三角的用戶偏好某款低價商品從而拉低了成交額等,再調整經營策略,慢慢的長三角用戶的成交額也逐漸提高了,畢竟長三角用戶錢多,分分鐘出效果。

其實相似的場景案例特別多,通過發現KFC的特點來進行分店鋪選址、通過GIS地圖發現食道癌集中於廣東潮汕和河南林縣、通過城市各小區數據來對比進行購房、通過地圖了解各景點的人流情況來制定合適的旅行地點和時間、通過地圖分布了解不同地區的飲食習慣選擇經營的店鋪類型、通過訂單的位置和倉庫進行匹配,找出最科學的倉庫位置,規劃最優配送路線,合理安排車輛、人力,更好的分配資源,節約資金等等。

這樣的案例很多,通過地圖可以很明確了解相關的區域情況,對經營決策、績效調整、生活引導等方面都起到很好的幫助。

BDP個人版-零門檻可視化分析利器

如果有更多和數據有關的內容,可以關注我的公眾號,大家互相交流~

http://weixin.qq.com/r/b0QnP4bEktvtrcJc9xF9 (二維碼自動識別)


鏑次元君來分享一些用數據可視化說新聞故事的經典案例。

什麼才是真正的用數據講故事,實際上它(數據講故事)是直接的,至關重要的,既簡單又明了。

下面列舉的有關用數據講故事的經典例子未必是華而不實的,這些例子極具創造性的地方在於用最簡單的術語來表達豐富思想。

  • 米納德繪製的1812年拿破崙進攻俄國軍事圖

這張圖是關於拿破崙1812年戰爭的,由查爾斯約瑟夫米納德繪製。

如你所見,圖裡包含了表現整個軍事活動複雜要素的大量數據,但這卻未損害其設計的簡便性和指導意義。

  • 紐約最吵鬧的街區

這幅圖來自Ben Wellington為《紐約客》撰寫的《數據看紐約》(I Quant New York)一文,圖中講述的是冰淇淋車遭到投訴的街區。

文章中,作者引用紐約市的噪音投訴指數數據,不但向讀者呈現了哪些社區最嘈雜,也一併探究了這些嘈雜背後的因素。

  • 美國人40年的飲食習慣

在Danielle Kurtzleben的文章中,她使用美國農業部的數據點來對 「你與父母飲食方式的區別」這一命題進行量化分析。

該圖表顯示的是幾十年內的飲食差異,而不是對每個不同食物項目逐年進行比較,且表明了食品消費先減少,然後轉向增加。

根據圖表初始的內容和長期走勢,你可能會認為這證明了我們這一代更健康。然而,它持續顯示了食品中有益、有害成分的劇烈增長——圖表準確地反映變化,而不會片面地呈現某種營養元素值超過另一個。

  • 十萬顆閃亮的星

雖然3D在可視化中不總是被贊為理想的(觀測)方式,但這張圖證明了它的效用,尤其是在複雜的,幾乎不可預測的光年量級的學科中。

想觀測出太陽系的實際尺寸是非常困難的,更不用說星系或宇宙了。很多人試圖同時運用數據和圖片使這類觀測成為可能。十萬顆星星網站把關於宇宙尺寸的科學數據轉換成更易接受的術語辭彙。

當你選擇「瀏覽」屏幕上的大幅地圖時,你將看到一系列緩慢呈現的統計數據和3D視覺效果圖。這些數據能顯示出相對於太陽系而言我們所處的銀河系有多大。 雖然我們在屏幕上看到和光年相關的數字時,我們無法將它可視化,但這(地圖)給我們提供了可視化工具,進而可以運用它更好地理解學科術語。

  • 西雅圖居民如何決定住房

住房一直是個有趣的話題,特別是當它開始涉及到其他話題如中產階級時。來自《西雅圖時報》的視覺數據化故事對於理清事實有著重大作用。

正如你所看到的,對大多數社區而言,幾乎普遍存在同樣的關心。 大多數人(除了鬧市區,租金比較貴),最關心的是否能買得起房子。相對來說,同一批人對學校的質量,交通等也是同等關心的,而對於家庭人數的變化則很少關心。

這就很輕易表明了一種聯繫,即關心步行距離的人可能也關心住處是否與公共交通站接近。雖然這一聯繫就每個大城市而言可能都不一樣,但它提供了一個廣泛地將大量調研信息可視化的方式。

  • 機器如何破壞/創造工作機會

來自http://npr.org的這兩個圖表顯示了「機器的興起究竟對美國工作崗位的影響」,除了農業方面的工作大幅減少之外,藍領、服務業、白領等工作崗位都得到了增長。

如圖所示,滾動瀏覽時你會看到,在1850年美國大約有260萬人在農場工作,而在2013年約有160萬人。在1850年,51%的美國工人是農民,2013年只有1%。

要理解這個圖表,你不必具有數學天賦才能。該圖並不意味由於農民勞動力不足而經濟不穩定,它只是意味著隨著工作過程中機器的興起以及工業人口的增長,勞動力開始湧向了白領工作行業。

圖表不僅僅是表現失業率的變化,也表現了就業規模的變化,且在回答「由於某種原因而發生了什麼」這一問題方面展示出一個更現實的情況。

  • 當美國處在戰爭時期,你的生命有多長?

  • 一張呈現電話使用習慣的和弦圖

最後,這個和弦圖來自Visual Cinnamon。和弦圖的目標是顯示荷蘭手機用戶的趨勢,基本上顯示了當前的市場份額,以及受訪者在現有手機之前所持手機的類型。

因此,這張圖表實際上相當直接地表明了,以前擁有諾基亞的三星用戶的百分比是多少,對以前的手機保持忠誠度的諾基亞用戶的數量,以及蘋果從三星手中獲得的手機市場份額的數量,以及用戶在其它每種品牌間轉變或繼續持有的可能性。

翻譯:何續亮

校編:蔡家欣

運營:錢佳佳


科比-布萊恩特職業生涯投籃數據可視化。

Every shot Kobe Bryant ever took. All 30,699 of them

對科比20年職業生涯每一次投籃實現了投籃準確位置、種類、對手、時間的可視化。

最接近神的男人,真正的進攻無死角。純粹的優美和一意孤行,廣袤的中距離。

滑鼠上去可以看時間和對手

檢視一些特殊的進球(比如生涯第一個運動戰進球)

自然還可以自主篩選(對手?季後賽?跳投 / 灌籃?)


我感覺信息是讓人來看懂的,用最基礎的結論把事情講清楚就OK,感覺目前的可視化,就是擺設



你可以去看看這個帖子最近只要關於數據可視化都能看到大數據魔鏡的身影,這是趨勢嗎?誰用過高級版的,咋樣? - 數據分析工具,可視化的整合很不錯,圖標類型多樣,自己判斷下


元素周期表

股市K線


在這樣一個大數據時代背景當中,可視化發展速度肯定越來越快,就信息內容而言,其呈現方式也越來越多樣和先進。對於不同的受眾,呈現效果也肯定不一樣,而且對數據的解讀本身也需要一定的專業背景。

美國Teradata公司曾在全世界範圍內搜集過一些數據可視化經典案例,挑幾個個人比較喜歡的吧。

1、航線星雲

圖中的圓點代表航空公司,連線的粗細和遠近則反映不同航空公司之間的相似性,連線越粗或越短則代表兩家公司服務的城市越相似。

2、

這個分析顯示了所有正當保險索賠和欺詐保險索賠之間的聯繫。圖像中每個點(或節點)代表一個單個的保險索賠,因此整個圈就代表每個索賠。大的節點是經過調查確定的欺詐索賠,較小的節點是正當的或尚未調查過的索賠。節點間的線(或邊界)顯示出各索賠之間的聯繫,即可能是重複使用同一電話號碼、地址、銀行賬號信息、電子郵箱地址和註冊信息等。節點間的線越粗,意味著聯繫越緊密,諸如電子郵箱、地址和電話等信息的重複越多,索賠越可疑。

3、星門

該可視化分析展現的是在台灣完成的一系列用於分析電信客戶端阻止惡意網路攻擊的情形。它使用了2300名員工一年的互聯網使用的網路日誌,跟蹤每個用戶的網路瀏覽活動然後找出惡意行為的原點的詳細用法路徑。每個點(節點)表示由用戶訪問的網頁,每行(或邊緣)表示從一個網頁到另一網頁的路徑。線的粗細大小代表訪問時的時間,節點的大小代表計算網頁的128種性質,如類別、信譽評分、訪問次數、網頁內容和數據包的生存時間(TTL)值。節點的大小和連接程度,代表了網站風險的高低。4、萬博思圖可視化作品

這件可視化作品是北京萬博思圖信息技術有限公司基於自主研發的hplc 海量圖布局分析引擎製作而成的。它是採用獨特的視覺設計直觀反映圖數據的整體形態以及關聯關係,用於展示人際網路集團、通信傳播路線、金融資金流向、計算機控制關係等,輔助研究人員對數據進行分析。


優鍩科技的可視化領域探索據我了解還有: 基於地理位置信息的可視化方案 uEarth 以及用於日常運維的 uITA IT架構可視化.


tableau是國外,現在國內是數據可視化的也越來越多,如BDP個人版,定位就是零門檻的可視化分析利器,比較可視化也是一門數據技術,還只有很小部分的人會掌握,還有很多人想好好學習,這樣的工具也提供了比較好的平台。

【59秒可視化】之 全國空氣質量分析


此作品微信:


請問有哪些可視化工具分析多維數據比較好,比如平行坐標圖,有什麼簡單的工具嗎


現在市面上做數據分析的工具很多,最具有代表性的是tableau,從功能和用戶體驗兩個方面來說,都是相對最出色的。其實上面舉出的很多數據可視化案例都是個案,沒有一個軟體或者工具可以完全的做出一個性鮮明個例。大部分市面的工具更專註於準確,合理,易用性強的數據圖,比如傳統的bar, line, pie以及在這個基礎上變形的圖表。我認為,一個好的可視化圖表,準確,容易理解,易用性強是第一位的,酷炫是第二位的。但是大部分人一開始過分關注後者。


推薦閱讀:

在目前沒有實際數據資源的情況下,如何學習數據分析?
如何選擇合適的圖形表達論文的數據結果?
歐特克(autodesk)的一個能查看信息的BIM雲端軟體是什麼?
人際關係可視化圖譜相關軟體求推薦?
中國好用的數據挖掘分析、數據可視化軟體?

TAG:數據可視化 |