小白準備自學做可視化數據分析?應該怎樣入手?

我以後想要走可視化數據新聞的方向,知道需要學習編程,設計,以及資料庫,迷茫要怎麼入手,所以先開始學了python。求大神指教,應該怎樣有序有效地學習,有沒有什麼推薦的課程和書目。

我大學畢業一年,自覺自己能力不夠,想要努力學習,充實自己。

進不入以離尤兮,退將復修吾初服。與君共勉


謝邀。

先為你的志向點贊:)

接下來分享一些我個人的建議。

首先,你想要走可視化數據新聞的方向,那麼不如堅持閱讀兩「位」可視化數據新聞大牛——New York Times,以及National Geographic: Stories of Animals, Nature, and Culture

這兩家媒體的可視化新聞早在五年前就非常精彩了。舉個例子:

這是國家地理雜誌2012年2月的一個關於狗的調查。每一根條形都代表著一種常見的狗品種,顏色代表著類別,而顏色的長短則代表著該狗的DNA落入不同類別的比例。

通過這張圖,我們不但了解了每種狗狗自己的「血統」,而且還看到了在85種最常見的狗狗當中,狼犬、獒犬、牧羊犬與獵犬的分布。

人腦處理信息的能力是有限的,但是通過長短、顏色、大小等,我們可以對數據背後隱藏的秘密一目了然。這就是可視化分析的魅力,也是它的目的。每當我看到優秀的可視化作品的時候,都會覺得真心讚歎。我想,每當一個數據可視化新聞工作者製作出一張有意義的可視化圖表時,也是熱血沸騰的把。

另外一部作品來自於New York Times 2012年6月的專題文章《隱形居民》。人類微生物組織項目用兩年的時間,調查了242個健康人身上的細菌和其它微生物。不同的顏色代表著不同的部位,從圓圈中心「發射」出來的樹狀結構則是細菌的「族譜」,顏色的長短代表著細菌在人類該部位分布的多寡。整張圖細節非常豐富,可以點大了細細研究~

有人專門撰文,講解了我們可以從New York Times學習的關於數據可視化的十件事,如果你有興趣,可以讀:10 Things You Can Learn From the New York Times』 Data Visualizations 裡面結合了新聞工作者+數據可視化人員的「工作守則」,對於行業人士來說,讀起來挺受用的。

另外,如果你想集中欣賞一下New York Times的數據可視化新聞作品,還可以看這裡:New York Times | FlowingData 不用自己在nyt的網站裡面翻,一口氣看下來很解渴。

既然已經提到了Flowing Data,就不得不提站在Flowing Data背後的男人:Nathan Yau了。他的中文名字叫做邱南森,關於他的介紹可以從這個回答里看到:知乎用戶:國內外有哪些數據可視化做的比較好的公司或者達人?

男神的優秀作品非常多,在FlowingData 可以有一個全面的了解。FlowingData中的乾貨也很多,想要在觀念、審美、技術等方面跟上世界的腳步,值得follow:

上圖是網站的分類:)

不過我最喜歡男神的地方是他還非常幽默。比方說《權利的遊戲》這個話題,明明可以做各種各樣的分析的,但是他卻選擇了這個角度:

也是任性~

————————————————————————————————

最後,關於應該怎樣入手,推薦這個回答:

薄名:文科生決心做數據分析師是不是瘋了?

興趣是一個人最好的導師,理想是疲憊路上燃燒的雞血,以書為枕,以血為鑒,祝你成功。


看到數據新聞之後,不請再來了哈哈。

坐標:國內某211的新聞與傳播學院大三學生,和題主一樣決定以後走數據新聞這條路了,但我也是今年剛剛開始打算走這條路的,所以談不上什麼指導性建議,,所以我就以一個同行人的視角講一下我的的安排和規劃。

題主首先說想從事可視化數據新聞方面的工作,想學習python和資料庫等等技術。但是一份好的可視化數據新聞絕非靠酷炫的技術或圖表就能贏得大量眼球的,碎片化信息時代,內容至上這條王道至上在這20年不會過時,所以在學習這些硬本領之前首先得掌握一項更重要的能力——講故事的能力(深度報道),記得今年年初的時候看到一個新聞,美聯社對全美的記者做了一個關於「大數據時代,記者在未來最想提升的能力」的抽樣調查,結果排名第一的是數據可視化的能力,第二緊跟著就是深度報道的能力

第二,數據新聞的可視化是藝術與技術完美交融的成品,在學習python和sql這些架構、軟體時,更應該多多瀏覽一份好的可視化作品如何去設計的,怎樣運用色彩,運用哪一種圖表更好等等問題。

這裡先安利三個公眾號都是國內在數據可視化方面做的比較好的的媒體和互聯網公司,財新我就不說了,中國第一個嘗試將大數據技術和可視化技術滲透入新聞報道中的媒體,其作品個個都是經典。網易數讀憑藉網易新聞強大影響力也是發展迅猛,鏑次元則是可視化互聯網公司的後期之秀。

還有一個就是澎湃新聞的美術課,不過他們的小編好像不太喜歡微信推送,這個必須要用下載APP瀏覽。

還有人民網和新華網的可視化報道,這裡不贅述了

除了國內的媒體要學習借鑒,國外的也不能放過,樓上說的很對,可視化數據新聞的兩個大牛非常值得學習,不過我聽到的兩個大牛版本不一樣,the guardianNew York TIMEthe guardian(《衛報》)是全球最早實踐數據新聞的媒體(從2009年就開始了,中國最早的財新是在2013年才開始),而且the guardian的網站瀏覽不需要翻牆,所以這裡推薦the guardian

the guardian基於2015年美國最高法通過同性戀婚姻法案撰寫的數據新聞,從多個維度切入,層層分析,一圖勝千言https://www.theguardian.com/world/interactive/2012/may/08/gay-rights-united-states(推薦電腦瀏覽)

國外媒體對於可視化數據新聞的定義也變變得更加寬泛了,遠遠超出了互動式圖表或地圖的圖文報道信息

英國BBC2015年發表的新聞遊戲Syrian Journey: Choose your own escape route(敘利亞之旅:選擇你自己的流亡路線)是一個有名的案例,基於一手的新聞素材,讓人們參與到流亡之旅,親身感受戰亂的影響http://www.bbc.com/news/world-middle-east-32057601(推薦電腦瀏覽)

第三,數據新聞處理數據,我並不推薦一開始就用Python ,sql 這類需編程基礎的架構、軟體,無編程類的數據分析可視化軟體會更上手,我這裡會推薦Tableau,零編程基礎

等你熟練掌握了各類圖表後,學習這種Python還有sql還有可視化R語言,D3會更順。

純粹同行人的規劃而已,題主加油,共勉


系統學不如激情學.. Fake it until you make it

具體來說,就是每每看到可視化作品,產生——哇這個作品好棒,我想做——的想法時,去了解一個作品是怎麼做出來的。

一個成熟的可視化數據分析是可以分拆成很多個步驟的。你可以先問問自己,想學是因為自己對哪一個步驟最感興趣。

第一步是數據收集。看起來好像是很枯燥的一步,但是做得好你也會被自己可以做到什麼地步驚呆... 網上有教程教你如何扒鏈家網站上的房源數據來做房子買在哪裡的決策,如何使用豆瓣API來獲取好電影的排名,如何用微控制器收集手機wifi信號跟蹤記錄每天行程...

數據收集如果你不想追著政府/公司PR要數據,一般涉及到的語言是 Python / R

第二步是數據分析。建議把高中及大學統計課/大學社科方法論課/大學基本高數複習一遍,配著多看案例,嘗試複製別人的分析,基本上 Python/R 也可以搞定。數據分析可難可易,用在媒體、學界和用在商業公司上大半是為了不同目的,找案例也要對症下藥,不然你學了新聞的做法,拿到公司裡邊用處也有限。

第三步就是炫酷的數據可視化,啦。其實如果你只要學數據可視化,不一定要學Python, R, 資料庫。紐時的可視化,也並不是全都用代碼碼出來的!取決於你的編程基礎,很多炫酷的數據可視化其實AI就可以搞定,一般走這條路的牛人都有很強的平面設計背景;如果想快速地炫酷、想學編程,前端HTML/CSS/Javascript先學起來。還是一句話,多看案例+嘗試複製。(如果是認真想學數據可視化,我並不推薦拿已有的數據可視化工具來做圖,那些是為了高效模式化生產而誕生的,並不適合學慣用)

如果你在這其中任何一步做出一點東西來,就會順其自然地想學另外的兩步,最重要的是momentum : )


與題主經歷相似,畢業一年,產品經理轉數據分析師,沒人帶,只能自己摸索學習,有些小建議供題主參考。

第一,用在行約行家。

在學習過程中難免遇到門檻和瓶頸。如果感覺目前進步很慢的時候,找一個過來人聊聊會有很多收穫。

第二,找一些志向相同的朋友,參加一些學習小組。

一個人在學習過程在獲取到的知識是有限的,但是有一些學習目的相同的人交流,碰撞會產生很多有價值的點。


推薦閱讀:

TAG:數據挖掘 | 數據分析 | 數據可視化 | 編程入門 | 數據新聞 |