數據圖表化的兩個關鍵點

一般來說,大家都不太願意直接看數據,更希望通過圖表來進行呈現。今天,我們討論圖表化數據的問題。

第一個關鍵點

首先,請簡單地看這麼一個例題。假設一個企業有不同的收入,然後同時可能有不同的利潤,那麼利潤率就是等於利潤/收入,於是利潤率就有了如表所示的各種數值(第一行代表利潤,第二行代表收入)。

現在,有三個變數,收入、利潤和利潤率,那麼應該如何用圖形來表示三者的關係的?

最容易想到的就是用三維的圖形來表達。X、Y軸分別代表收入與利潤,而Z軸則是代表了利潤率。

然而,這張圖看上去似乎將表中的信息完全展示出來,但是由於三維圖在平面上是通過透視的方法進行描繪的,這導致我們並不能很準確地對圖形進行理解。我們看不出曲面與坐標軸之間的相互關係,也看不出曲面內部各個點之間的相互關係,設置在圖上的任何一點,我們都不能準確地確定其實際的位置,因為透視三維圖上的任意一點都表示的是一條線的可能。

所以,雖然三維圖將表中的信息最大限度地體現和展示出來,但是由於人們眼睛對於平面上的視覺限制,這種三維圖的效果反而沒什麼實際的價值。

如果退而求其次,我們如果採用二維坐標,那麼就可以在平面上很容易表示兩者的關係,但是卻必須捨棄其中一個變數。例如,如果以收入和利潤來作為橫縱坐標,在利潤率為30%、40%、50%的情況下,兩者之間的關係如圖所示。

現在圖傘的表示中並沒有充分包含表格中的所有信息,但是相對於圖二的三維圖,圖三的表示方法用戶更容易直觀理解。

結論一:圖表的表示應該以讓讀者能夠更容易理解表格數據的內在規律,而不是以能夠更多更全面的包含所有數據的信息。必要的省略有時候更能夠幫助讀者抓住重點,理解本質。

第二個關鍵點

如前圖三所示,我們可以把三個變數的角色進行了分解:收入當做自變數,利潤當做因變數,而利潤率則是作為約束條件,在不同的約束條件下,隨著收入的變化,利潤也隨之變化。

但是問題在於,為什麼這三個變數之間的角色分配必須如此呢?

比如,如圖四所示,可以選擇利潤率作為自變數,利潤在不同收入條件下的變化情況,或者是收入作為自變數,利潤率在不同利潤條件的變化情況。

理論上來說,三個變數就存在6種不同數據角色分配方式。如表所示。

也許大家會覺得這其實是在玩一種數字遊戲,因為利潤率=利潤/收入,所以其實6中不同的數據表達形式無非是數字上的變化。事實上,對於數據分析來說,這6種不同的數據角色分配方式表現出不同的內涵和意義。

比如,在收入為橫坐標、利潤率為縱坐標,利潤為約束條件的時候,這意味著需要保證固定的利潤,因此在擴大市場規模以及並因此導致的利潤率下降之間尋找到一條可能的界限。

或者是以利潤為橫坐標,利潤率為縱坐標,收入為約束條件的時候,這表示的是收入是一個固定額,然後需要考慮如何通過擴大利潤來提升利潤率的水平。

結論二,雖然圖表數據是相同的,但是圖表數據的展現和表達的不同也是有意義的。也許從數學上看可能僅僅是數學的變換,但是這其實代表了實際場景和目標的的差異。

微信公眾號:銳合金狗眼,與本專欄同步更新!


推薦閱讀:

為什麼沒人為 Linux Terminal 設計鍵入提示功能?
迅雷有哪些體驗不好的地方?
從「打天下」到「治天下」,從歷史看互聯網發展
有用勝於有趣:6 條 UX 設計動畫原則
知乎上哪些用戶已經體驗過,韓國大宇(Daewoo)出的這款壁掛式全自動滾筒洗衣機, 真實體驗如何?

TAG:数据分析 | 用户研究 | 用户体验 |