數據產品開發前的必修課之數據圖表應用
音樂作伴,閱讀更快樂!
(此篇理應命名為數據產品開發前的必修課(二)[詳情了解前篇內容請點擊標題》:經驗分享 :數據產品開發前的必修課 ]如前篇所提,今起,針對數據圖表略表淺見。圖表是件花衣裳,你得懂得怎麼穿!)
初階的餅圖、環形圖、折線圖、柱形圖、條形圖等就不多說了,因為他們直觀到無需解釋。但需要提一下做這些圖的時候的細節:
(可跳過不看)
首先,告別excel默認的樣式和配色,因為那樣會使你的報告逼格很低。
在我平時工作中,許多夥伴會問「你這圖表用什麼軟體做的?感覺好高級?」,我說「excel啊」,他們吃驚不已。如何達到這些效果?
先仔細摸索圖表布局選項卡下的坐標軸、網格線、趨勢線、圖例,標籤等功能細節;其次是熟悉繪圖區格式裡面的細節,如調整圖表區域的配色,合理使用陰影等;最後是選擇合適的圖表來反映問題,這一點其實相當複雜,在後續的文章中會循序漸進地提及(結合一些場景),一股腦地說,我寫得辛苦你讀的累,划不來。
推薦一本劉萬祥的《Excel圖表之道》,它會讓你驚嘆於excel作圖功能是如此的強大。
進入主題:強大的散點圖
首先,散點圖確實能很直觀的反應兩個變數之間的關係。
案例一:利用散點圖觀察不同來源流量與網站總流量的關係。
上圖展示了某公司主站的新訪客各來源渠道與總新訪客量。
結論很直觀:
direct(直接訪問來源)、organic(自然搜索來源)和總的新訪客有明顯的正相關關係(direct與newuv相關係數達到0.89,direct來源的佔比達到60%)。因此,我們知道這個公司大部分訪客來源於口碑,而且其潛力還相當大,因為direct和organic圖顯示新訪客對direct的彈性比較高,沒有出現像sem(藍色)圖那樣的邊際效益遞減的情況。
(一些名詞解釋我會在文章最後列出)
通過組合型散點圖,我們已經得到了一些有價值的信息。我個人對sem來源的變化趨勢非常感興趣。針對這點我們繼續挖掘信息。
案例二:在散點圖上用顏色增加一個分析維度,並添加平滑趨勢線。
圖中,我將sem來源的訪問量按四分位數進行了分層,配合局部加權多項式擬合線。
似乎又有了新的收穫:
1.sem來源流量較少時(紅色和綠色,後50%),與總流量的正相關關係是比較明顯的。
2.sem來源流量在75%到50%分位數(綠色)之間非常集中。我猜測,使sem流量維持在這個水平的投放策略,看來是有一種粘性的,即便加大投放,在一定幅度內,sem的流量增長也不明顯,直到突破某個臨界值,進入藍色和紫色區域後,才會鬆開。
3.較高sem流量(藍色和紫色,前50%),與總流量的關係非常弱,擬合線幾乎平了。
到這裡,您可能會這麼問:sem流量在什麼程度才是最優?
要衡量這個問題,我選取了sem投放總成本,sem單位點擊成本(cpc),和sem來源的註冊轉化率三個指標。讓可愛的散點圖升級!
案例三:點的大小衡量一個新的指標,散點圖進化為氣泡圖
氣泡圖,就是除了橫縱坐標軸,點的大小還能衡量一個變數的散點圖。上圖不僅衡量了sem投放總成本(semCOST)和sem來源流量(semUV),還用點的大小衡量註冊轉化率(regRate)。結論比較直觀,註冊轉化率高的點,在右上方,且預測線顯示,投放力度越大,流量越大,且註冊轉化率至少不變。
得到這個結論有點振奮了,有沒有?
還能不能再增加點信息?可以,我們將單位點擊成本進一步放到散點圖中。
案例四:氣泡的顏色再衡量一個變數,升級為彩色氣泡圖
如圖,點的大小是註冊轉化率,點的顏色是單位點擊成本,從暖色調到冷色調,由低到高。轉化率高且cpc低的點,在右上角。
我們可以說,sem投放成本越高,sem流量越多,且轉化率越高,更可喜的是cpc還更低。對於一個sem投放部門來說,沒有比這更完美的結論了。
但是,散點圖只是反映了相關關係,並不是因果關係。我們不能說,增加sem投放是註冊轉化率升高且cpc降低的原因。但是,有這麼顯著的相關關係,我們就有足夠的理由去增加投放,然後再去觀察數據。
數據分析再精確,如果縮手縮腳,是依然辦不成事情的。
當然,投放策略分析是可以做得非常複雜的,我們這裡只是為了介紹散點圖而引入了這個場景,初步地做個分析。但在中小企業,我覺得做到這一步就可以了。(這幾張圖估計可以把老闆搞暈了,然後給你一大筆預算!)
數據分析(ID : ecshujufenxi )互聯網科技與數據圈自己的微信,也是WeMedia自媒體聯盟成員之一,WeMedia聯盟覆蓋5000萬人群
推薦閱讀:
※產品開發流程(CA-PDS)總體簡介——長安汽車
※亞馬遜產品開發日誌(8)減法法則做產品
※亞馬遜產品開發日誌(7)淡季應該幹啥
※傲基(AUKEY)的產品開發思維