從沒學過數據可視化,怎樣從小白開始系統的學習數據可視化?


首先打個基礎:

課程:

必學且免費的基礎課:統計學 | Udacity(http://cn.udacity.com/course/statistics--st095)

書籍:

必看的入門書:《精益數據分析》[美]埃里克-萊斯 叢書主編

《最簡單的圖形與最複雜的信息》[美]黃慧敏

接下來嘗試把把紙上知識實際操練起來。這裡你可以用excel,也可以用更智能、更fashion一點的工具,比如說:

工具:

數據觀

好處就是操作起來特別簡單,不需要編程,也不需要懂什麼excel技巧,很適合新手在演練中梳理、內化數據分析的知識與思路。相信如果工具不好用的話,你花在「kao這一步怎麼實現的」上的時間會遠遠大於「哪個指標、什麼圖表類型更適合解決我現在的問題」上。

畢竟咱們拼的不是編程技術高低,而是用數據解決問題的能力。

可視化效果也棒棒的,還可以實現下鑽、過濾等交互功能:

可以免費試用一下哈:數據觀(https://www.shujuguan.cn/?from=2018060804)


首先要看你的職業規劃,如果你是以業務為主的數據分析,給非專業人士展示,學習powerBI,tableau,一個小時足矣。

如果你是以技術為主的數據分析,或數據挖掘,給專業人士展示,學習Python,R語言, Python中可視化的工具有matplotlib,seaborn,ploltly; R中可視化工具有plot基礎庫、ggplot2。

隨心所欲,用Python和R,你就知道做數據分析工作是多麼爽一個事


對於入門小白,建議從excel工具入手

學習excel也是一個循序漸進的過程

  • 基礎的:簡單的表格數據處理、列印、查詢、篩選、排序
  • 函數和公式:常用函數、高級數據計算、數組公式、多維引用、function
  • 可視化圖表:圖形圖示展示、高級圖表、圖表插件
  • 數據透視表、VBA程序開發

函數和數據透視表是兩個重點:

製作數據模板必須掌握的excel函數

  • 日期函數:day,month,year,date,today,weekday,weeknum。日期函數是做分析模板的必備,可以用日期函數來控制數據的展示,查詢指定時間段的數據。
  • 數學函數:product,rand,randbetween,round,sum,sumif,sumifs,sumproduct
  • 統計函數:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs。統計函數在數據分析中具有舉足輕重的作用,求平均值,最大值,中位數,眾位數都用得到。
  • 查找和引用函數:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata。這幾個函數的作用不用多說,特別是vlookup,不會這個函數基本上複雜報表寸步難行。
  • 文本函數:find,search,text,value,concatenate,left,right,mid,len。這幾個函數多半用在數據整理階段使用。
  • 邏輯函數:and,or,false,true,if,iferror

(以上學會,基本能秒殺90%的辦公室白領。)

數據透視表

數據透視表的作用是把大量數據生成可交互的報表,數據透視表具有這樣一些重要功能:分類匯總、取平均、最大最小值、自動排序、自動篩選、自動分組;可分析佔比、同比、環比、定比、自定義公式。

對於浸淫多年的表哥表姐

現實中,取數或報表+EXCEL+PPT似乎還是主流形式。

工具上,無論是業務人員還是分析人員,都可以通過自動取數工具或者BI工具來製作報表,減少重複操作的時間。

其次,增加與業務人員的溝通,充分了解並挖掘需求,當你的業務水平和他們差不多甚至更高時,自然而然知道真實的需求是什麼了。

最後,站在更高角度上,技術上,報表工作可以用專業的報表工具,比如FineReport來替代。報表的基本粒度就是指標,可梳理出企業的基本指標體系,從經營分析的角度去做報表,把報表的工作標準化,降低報表的冗餘,避免動不動就做一張報表。標準化包括指標分類,指標命名,業務口徑,技術口徑,實現方式等等。其實,最終目的是實現報表數據一致性,減少重複報表開發,降低系統開銷的戰略性舉措。

業餘時間可以拓展自己的知識面,往上下游發展,補充數理統計知識,學習R、Python語言,都是提升自己的很好方式。


  什麼是數據可視化?什麼是數據分析?什麼是數據挖掘?這些問題可能是初學者最混淆的,今天西線學院小編就給大家講講什麼是數據可視化。

  說到可視化,就不得不說一下大數據,畢竟可視化是解決大數據的一種高效的手段,而如今人人都在談論大數據,大數據 ≠ 有數據 ≠ 數據量大, 離譜的是,如今就連賣早點的覺得自己能統計每天賣出的種類,都敢說自己是搞大數據。

  時間推移到 2009 年,「大數據」 開始才成為互聯網技術行業中的熱門辭彙。對「大數據」進行收集和分析的設想,起初來自於世界著名的管理諮詢公司麥肯錫公司;麥肯錫公司看到了各種網路平台記錄的個人海量信息具備潛在的商業價值,於是投入大量人力物力進行調研,在 2011 年 6 月發布了關於「大數據」的報告,該報告對「大數據」的影響、關鍵技術和應用領域等都進行了詳盡的分析。麥肯錫的報告得到了金融界的高度重視,而後逐漸受到了各行各業關注。

  定義

  數據可視化的目的其實就是直觀地展現數據,例如讓花費數小時甚至更久才能歸納的數據量,轉化成一眼就能讀懂的指標;通過加減乘除、各類公式權衡計算得到的兩組數據差異,在圖中顏色敏感、長短大小即能形成對比;數據可視化是一個溝通複雜信息的強大武器。通過可視化信息,我們的大腦能夠更好地抓取和保存有效信息,增加信息的印象。但如果數據可視化做的較弱,反而會帶來負面效果;錯誤的表達往往會損害數據的傳播,完全曲解和誤導用戶,所以更需要我們多維的展現數據,就不僅僅是單一層面。

  

  背景

  我們可以想一想,在大數據沒有出現之前,已經有很多對數據加以可視化的經典應用,比如股市裡的 K 線了,其試圖以可視化的目的來發現某些規律,信息可以用多種方法來進行可視化,每種可視化的方法都有著不同的著重點,特別是在大數據時代,當你打算處理數據時。首先要明確並理解的一點是:你打算通過數據向你的用戶講述怎樣的故事,數據可視化之後又在表達著什麼?

  通過這些數據,能為你後續的工作做哪一些指導性工作,是否能幫觀者正確的抓住重點,了解行業動態?了解這一點之後,你便能選擇合理的數據可視化方法,高效傳達數據。

  當我們能夠充分理解數據,並能夠輕易向他人解釋數據時,數據才有所價值;我們的讀者可以通過可視化互動或其他數據使用方式來探尋一個故事的背後發生了什麼,因此,數據可視化至關重要。

  數據的特性

  數據可視化,先要理解數據,再去掌握可視化的方法,這樣才能實現高效的數據可視化,下面是常見的數據類型,在設計時,你可能會遇到以下集中數據類型:

  量性:數據是可以計量的,所有的值都是數字

  離散型:數字類數據可能在有限範圍內取值。例如:辦公室內員工的數目

  持續性:數據可以測量,且在有限範圍內,例如:年度降水量

  範圍性:數據可以根據編組和分類而分類,例如:產量銷售量

  可視化的意義是幫助人更好的分析數據,也就是說他是一種高效的手段,並不是數據分析的必要條件;如果我們採用了可視化方案,意味著機器並不能精確的分析。當然,也要明確可視化不能直接帶來結果,它需要人來介入來分析結論。

  在大數據時代,可視化圖表工具不可能「單獨作戰」,而我們都知道大數據的價值在於數據挖掘,一般數據可視化都是和數據分析功能組合,數據分析又需要數據接入整合、數據處理、ETL等數據功能,發展成為一站式的大數據分析平台。

  工具——編程語言

  R 經常被稱為是「統計人員為統計人員開發的一種語言」。如果你需要深奧的統計模型用於計算,可能會在 CRAN 上找到它――你知道,CRAN 叫綜合R檔案網路(Comprehensive R Archive Network)並非無緣無故。說到用於分析和標繪,沒有什麼比得過 ggplot2。而如果你想利用比你機器提供的功能還強大的功能,那可以使用 SparkR 綁定,在 R 上運行 Spark。

  Scala

  Scala 是最輕鬆的語言,因為大家都欣賞其類型系統。Scala在JVM上運行,基本上成功地結合了函數範式和面向對象範式,目前它在金融界和需要處理海量數據的公司企業中取得了巨大進展,常常採用一種大規模分散式方式來處理(比如Twitter和LinkedIn)。它還是驅動Spark和Kafka的一種語言。

  Python

  Python 在學術界當中一直很流行,尤其是在自然語言處理(NLP)等領域。因而,如果你有一個需要 NLP 處理的項目,就會面臨數量多得讓人眼花繚亂的選擇,包括經典的 NTLK、使用 GenSim 的主題建模,或者超快、準確的 spaCy。同樣,說到神經網路,Python 同樣遊刃有餘,有 Theano 和 Tensorflow;隨後還有面向機器學習的 scikit-learn,以及面向數據分析的 NumPy 和 Pandas。

  Java

  Java 可能很適合你的大數據項目。想一想 Hadoop MapReduce,它用 Java 編寫。HDFS 呢?也用 Java 來編寫。連 Storm、Kafka 和 Spark 都可以在 JVM 上運行(使用 Clojure 和 Scala),這意味著 Java 是這些項目中的「一等公民」。另外還有像 Google Cloud Dataflow(現在是 Apache Beam)這些新技術,直到最近它們還只支持 Java。

  

  可視化框架

  Echart.js

  D3.js

  Highchart.js

  Antv.js

  合理的可視化

  我將可視化圖表分為以下幾類:

  每個可視化圖表的類型以一個合理圖表的呈現的形式來舉例說明,(該部分總結自 Antv)。

  比較類

  比較類顯示值與值之間的不同和相似之處。 使用圖形的長度、寬度、位置、面積、角度和顏色來比較數值的大小, 通常用於展示不同分類間的數值對比,不同時間點的數據對比。

  柱形圖

  柱狀圖有別於直方圖,柱狀圖無法顯示數據在一個區間內的連續變化趨勢。柱狀圖描述的是分類數據,回答的是每一個分類中「有多少?」這個問題。 需要注意的是,當柱狀圖顯示的分類很多時會導致分類名層疊等顯示問題。

  

  適合的數據:一個分類數據欄位、一個連續數據欄位

  功能:對比分類數據的數值大小

  數據與圖形的映射:分類數據欄位映射到橫軸的位置

  連續數據欄位映射到矩形的高度

  分類數據也可以設置顏色增強分類的區分度

  適合的數據條數:不超過 12 條數據

  分布類

  分布類顯示頻率,數據分散在一個區間或分組。 使用圖形的位置、大小、顏色的漸變程度來表現數據的分布, 通常用於展示連續數據上數值的分布情況。

  散點圖

  散點圖也叫 X-Y 圖,它將所有的數據以點的形式展現在直角坐標繫上,以顯示變數之間的相互影響程度,點的位置由變數的數值決定。

  通過觀察散點圖上數據點的分布情況,我們可以推斷出變數間的相關性。如果變數之間不存在相互關係,那麼在散點圖上就會表現為隨機分布的離散的點,如果存在某種相關性,那麼大部分的數據點就會相對密集並以某種趨勢呈現。數據的相關關係主要分為:正相關(兩個變數值同時增長)、負相關(一個變數值增加另一個變數值下降)、不相關、線性相關、指數相關等,表現在散點圖上的大致分布如下圖所示。那些離點集群較遠的點我們稱為離群點或者異常點。

  適合的數據:兩個連續數據欄位

  功能:觀察數據的分布情況

  數據與圖形的映射:兩個連續欄位分別映射到橫軸和縱軸。

  適合的數據條數:無限制

  備註:可更具實際情況對點的形狀進行分類欄位的映射。

  點的顏色進行分類或連續欄位的映射。

  

  流程類

  流程類顯示流程流轉和流程流量。 一般流程都會呈現出多個環節,每個環節之間會有相應的流量關係,這類圖形可以很好的表示這些關係。

  漏斗圖

  漏斗圖適用於業務流程比較規範、周期長、環節多的單流程單向分析,通過漏斗各環節業務數據的比較能夠直觀地發現和說明問題所在的環節,進而做出決策。漏斗圖用梯形面積表示某個環節業務量與上一個環節之間的差異。漏斗圖從上到下,有邏輯上的順序關係,表現了隨著業務流程的推進業務目標完成的情況。

  漏斗圖總是開始於一個100%的數量,結束於一個較小的數量。在開始和結束之間由N個流程環節組成。每個環節用一個梯形來表示,梯形的上底寬度表示當前環節的輸入情況,梯形的下底寬度表示當前環節的輸出情況,上底與下底之間的差值形象的表現了在當前環節業務量的減小量,當前梯形邊的斜率表現了當前環節的減小率。 通過給不同的環節標以不同的顏色,可以幫助用戶更好的區分各個環節之間的差異。漏斗圖的所有環節的流量都應該使用同一個度量。

  

  圖表類型:漏斗圖

  適合的數據:一個分類數據欄位、一個連續數據欄位

  功能:對比分類數據的數值大小

  數據與圖形的映射:分類數據欄位映射到顏色

  連續數據欄位映射到梯形的面積

  適合的數據條數:不超過12條數據

  佔比類

  佔比類顯示同一維度上佔比關係。

  餅圖

  餅圖廣泛得應用在各個領域,用於表示不同分類的佔比情況,通過弧度大小來對比各種分類。餅圖通過將一個圓餅按照分類的佔比劃分成多個區塊,整個圓餅代表數據的總量,每個區塊(圓弧)表示該分類佔總體的比例大小,所有區塊(圓弧)的加和等於 100%。

  

  適合的數據:列表:一個分類數據欄位、一個連續數據欄位

  功能 對比分類數據的數值大小

  數據與圖形的映射:分類數據欄位映射到扇形的顏色

  連續數據欄位映射到扇形的面積

  適合的數據條數:不超過 9 條數據

  區間類

  區間類顯示同一維度上值的上限和下限之間的差異。 使用圖形的大小和位置表示數值的上限和下限,通常用於表示數據在某一個分類(時間點)上的最大值和最小值。

  儀錶盤

  儀錶盤(Gauge)是一種擬物化的圖表,刻度表示度量,指針表示維度,指針角度表示數值。儀錶盤圖表就像汽車的速度表一樣,有一個圓形的錶盤及相應的刻度,有一個指針指向當前數值。目前很多的管理報表或報告上都是用這種圖表,以直觀的表現出某個指標的進度或實際情況。

  

  儀錶盤的好處在於它能跟人們的常識結合,使大家馬上能理解看什麼、怎麼看。擬物化的方式使圖標變得更友好更人性化,正確使用可以提升用戶體驗。

  適合的數據:一個分類欄位,一個連續欄位

  功能 對比分類欄位對應的數值大小

  數據與圖形的映射:指針映射到分類欄位,指針的角度映射連續欄位

  適合的數據條數:小於等於3

  關聯類

  關聯類顯示數據之間相互關係。 使用圖形的嵌套和位置表示數據之間的關係,通常用於表示數據之間的前後順序、父子關係以及相關性。

  矩形樹圖

  矩形樹圖由馬里蘭大學教授 Ben Shneiderman 於上個世紀90年代提出,起初是為了找到一種有效了解磁碟空間使用情況的方法。 矩形樹圖適合展現具有層級關係的數據,能夠直觀體現同級之間的比較。一個Tree狀結構轉化為平面空間矩形的狀態,就像一張地圖,指引我們發現探索數據背後的故事。

  

  適合的數據:帶權的樹形數據

  功能 表示樹形數據的樹形關係,及各個分類的佔比關係

  數據與圖形的映射:樹形關係映射到位置,佔比數值數據映射到大小。設置顏色增強分類的區分度

  適合的數據條數:大於5個分類

  趨勢類

  趨勢類分析數據的變化趨勢。 使用圖形的位置表現出數據在連續區域上的分布,通常展示數據在連續區域上的大小變化的規律。

  折線圖

  折線圖用於顯示數據在一個連續的時間間隔或者時間跨度上的變化,它的特點是反映事物隨時間或有序類別而變化的趨勢。

  

  適合的數據:兩個連續欄位數據,或者一個有序的分類一個連續數據欄位

  功能 觀察數據的變化趨勢

  數據與圖形的映射:兩個連續欄位分別映射到橫軸和縱軸

  適合的數據條數:單條線的數據記錄數要大於2,但是同一個圖上不要超過5條折線

  時間類

  時間類顯示以時間為特定維度的數據。 使用圖形的位置表現出數據在時間上的分布,通常用於表現數據在時間維度上的趨勢和變化。

  面積圖

  面積圖又叫區域圖。 它是在折線圖的基礎之上形成的, 它將折線圖中折線與自變數坐標軸之間的區域使用顏色或者紋理填充,這樣一個填充區域我們叫做面積,顏色的填充可以更好的突出趨勢信息,需要注意的是顏色要帶有一定的透明度,透明度可以很好的幫助使用者觀察不同序列之間的重疊關係,沒有透明度的面積會導致不同序列之間相互遮蓋減少可以被觀察到的信息。

  

  適合的數據:兩個連續欄位數據

  功能 觀察數據變化趨勢

  數據與圖形的映射:兩個連續欄位分別映射到橫軸和縱軸

  適合的數據條數:大於兩條

  地圖類

  地圖類顯示地理區域上的數據。 使用地圖作為背景,通過圖形的位置來表現數據的地理位置, 通常來展示數據在不同地理區域上的分布情況。

  帶氣泡的地圖

  帶氣泡的地圖,其實就是氣泡圖和地圖的結合,我們以地圖為背景,在上面繪製氣泡。我們將圓(這裡我們叫它氣泡)展示在一個指定的地理區域內,氣泡的面積代表了這個數據的大小。

  

  適合的數據:一個分類欄位,一個連續欄位

  功能 對比分類數據的數值大小

  數據與圖形的映射:一個分類欄位映射到地圖的地理位置和氣泡顏色

  另一個連續欄位映射到氣泡大小

  適合的數據條數:根據實際地理位置信息,無限制

  用戶體驗

  用戶視覺

  合格的數據可視化是有新聞價值的。也就是說,它要能幫助目標觀眾更好地理解數據。有些數據可視化,只讓我們看到酷炫狂拽的圖形,或者密密麻麻的數據。這些就是過於看重藝術性和科學性,而忽略根本目的了。用信息研究的理論來說,數據看上去過於混亂和密集,用戶就會不由自主地「切斷數據的傳輸」。

  色彩空間

  人類對於顏色感知的方式通常包括三個問題:是什麼顏色?深淺如何?明暗如何?在HSV色彩空間中,H 指色相 (Hue),S 指飽和度(Saturation),V 指明度(Value),在 HSL 色彩空間中,L 表示亮度(Lightness)。它們比 RGB 色彩空間更加直觀且符合人類對顏色的語言描述。在 1979 年的 ACM SIGGRAPH(美國計算機協會計算機圖形學專業組)年度會議上,計算機圖形學標準委員會推薦將HSL色彩空間用於顏色設計。

  人群中存在一部分人具有視覺缺陷,包括色盲、色弱等。為了幫助他們識別圖表,可能需要採取一些特殊方法。

  一個好的可視化工程師,必定也是一個好的 UX(用戶體驗),所以不光要以易讀性為目標努力,用戶們也要問問自己:這份可視化是給我看的嗎?我看的方式是否正確?

  在數據可視化的工程中,你在分析中所採取的具體步驟會隨著數據集和項目的不同而不同,但在探索數據可視化和數據挖掘時,總體而言應考慮以下四點:

  擁有什麼數據?

  關於數據你想了解什麼?

  應該使用哪種可視化方式?

  你看見了什麼,有意義嗎?

  而去年我和我們廠的兩個同事聯合開發了可視化分析工具,還給業務人員舉行了一場比賽,順便在產品新版本發布前讓他(她)們幫我們測一下易用性,然而在比賽評比當晚,我有幸成為了評委,可惜參賽選手們解釋自己的作品時,有的雲里霧裡、有的激昂慷慨,很多都沒有說到點子上,甚至沒有充分利用到各個圖表類型的優勢,在這個滿世界談用戶體驗的時代,這場數據的「解說」顯然是糟糕的。

  那麼什麼是優秀的可視化作品。我一直認為最好的用戶體驗是深入淺出,所以,優秀的可視化作品 = 信息 + 故事 + 目標 + 視覺形式,因此,一件可視化作品是從數據 -> 交互 -> 視覺 -> 開發的一個過程。

  所以優秀的數據可視化依賴優異的設計,並非僅僅選擇正確的圖表模板那麼簡單。全在於以一種更加有助於理解和引導的方式去表達信息,儘可能減輕用戶獲 取信息的成本。當然並非所有的圖表製作者都精於此道。所以我們看到的圖表表達中,各種讓人啼笑皆非的錯誤都有。

  總結

  定義合適的可視化圖形,可以說是最為關鍵的。一般情況來看,線柱餅等基本圖形可以完成我們大部分的需求,這也是分析人員最常用的展現形式;但對於大數據場景或具體業務場景下就需要更加特殊的可視化。

  歸納起來一名數據可視化工程師需要具備三個方面的能力,數據分析能力、交互視覺能力、研發能力。

  不管你用什麼工具,別忘了你的目的是理解數據,這可是數據可視化工程師和軟體工程師的最大區別。

  關於數據可視化的內容還有很多,上面的知識只是想讓大家對數據可視化現有一個整體的了解,如果有興趣的小夥伴可以到西線學院來進一步了解數據可視化的內容。


看書-->實操-->產生新的問題-->看更多的書找到答案-->實操

我覺得是這樣一個不斷循環過程吧,畢竟我們進入職場,不是大學生了,沒有整塊的時間來讓你「系統學習」。所謂「系統學習」裡面也有很多知識是你在工作中不一定能夠遇到的。「小步快跑、敏捷迭代」是更適合職場人的學習方式。

第一周我的建議是讀一本數據可視化的書,這本書我建議是《最簡單的圖形與最複雜的信息》,作者是華爾街日報圖形設計總監Dona Wong,每天看一章,一共五章,連公休日都不佔用,保准你對「什麼是數據可視化」、「什麼是好的數據化」內心有底。怎麼說呢,讓大神來幫助你建立最初的是非與審美吧!

第二周我的建議是拿一份你工作中的數據進行實戰。利用excel分析也好,用那種自助式的免費的分析工具(比如bdp、數據觀)也罷,運用你在上一周學到的知識,做一份圖表出來。這一階段不要求你用數據解決什麼問題,就對歷史數據做一個客觀陳述就好,主要目的是熟悉工具、熟悉數據、鞏固數據可視化的基礎知識。

第三周你對數據可視化已經培養出了一份隱隱的自信,那麼現在你可以給自己提一個業務問題了,然後嘗試可視化分析。你會發現當你提問的時候,新的問題也會找上你——明顯,《最簡單的圖形與最複雜的信息》裡面的知識可能不夠用了,你發現自己需要學習一些更深入的東西,比方說函數,這個階段你可以求助於百度知道或知乎,免費的資源依舊一大把,只要你好學就會得到答案。

第四周你應該已經在「邊做邊學」中學會了一些基本的函數了:case when、datediff、substring、substring_index、nullif等;然後你發現你處於一種「腦子裡東西好像很多又好像不夠」的階段,這時候你需要一本稍微深點的書來幫助你重新梳理一下了,是時候看這本書了——《鮮活的數據:數據可視化指南》,作者是Nathan Yau,加州大學洛杉磯分校統計學專業博士,為《紐約時報》、CNN、Mozilla等工作過的超級數據迷,在這本書里你將看到大量優秀的數據可視化案例,同時被作者根據時間趨勢、比例、關係、差異、空間關係這幾大維度對你的底層邏輯「拿龍」,看書的過程會非常爽,甚至有可能影響你對可視化工具的選擇~同時你還能從中獲知大量的數據來源(然後可勁兒地操練自己吧!)。

就這樣,一個月的時間,你已經不是數據可視化小白了,手裡應該會有2~3份做好的數據可視化成果,心裡也知道下一步該做什麼、該學什麼——你已經正式啟航了~

如果覺得有用,就贊我讓我知道哦:)

祝你成功!

最後附上我的作品:


其實學習數據可視化的話,我絕對反對從Excel入門!

因為數據可視化發展到現在,已經有了很多完善的工具,就像我們家,不是打廣告,請聽我解釋~

以我自己舉例,當初看到Excel里什麼透視表、切片器、函數的時候感覺特別高大上,高大上到望而生畏,高大上到我預期自己掌握這些功能要特別久的時間,所以從大學就聽說了,一直到研究生畢業然後工作,都沒有撿起來學習。

但是後來進入了這一行,接觸了很多可視化的工具,比如Tableau,然後又用自己家的產品,最後發現那些高大上的功能用這些工具,1分鐘不到就可以搞定。

這時候我又重新去學習Excel(就是這麼不走尋常路~),發現困擾自己的一些功能已經拿下了,配合百度搜索一些操作細節,分分鐘搞定。

所以請相信我,學習數據可視化,先用專門的數據可視化工具,再去學習通用型的工具,不如Excel或SPSS之類的,你的效率要快很多!


可視化是連接用戶和數據的橋樑,是我們像用戶展示我們的成果的一種手段,因此可視化並不是非常特殊的研究領域,它可以有非常廣泛的應用和創建途徑,作為非計算機專業人員,你可以藉助現有的程序和軟體,根據自己的數據特點,繪製清楚直觀的圖表,Excel,SPSS,Google,pubic,Data等,一些博客也會介紹常用的可視化工具,比如22個免費的數據可視化和分析工具推薦,如果你有一定的編程基礎可以嘗試使用一些編程或者數學工具來進行自定義圖表繪製,更進一步你就可以用編程語言來寫自己的可視化系統了,這樣你就會有很自由的發揮空間和操控能力,數據處理表現形式,交互方式等都可以有很自主的設計,入門的話你可以去看看EdwardTufte的一些書籍


謝謝您的邀請!抱歉,我也不會,可以到專業的培訓機構學習。


推薦閱讀:

TAG:可視化 | 數據挖掘 | 教育 |