第1周 數據思維的培養

第1周 數據思維的培養

來自專欄數據分析

一、什麼是數據思維

什麼是數據思維?回答這個問題之前我們先來看兩種思維的樣例,下面是兩個管理人員對銷售額度下降的思考:

人員1:我們12月的銷售額度下降,我想是因為年終的影響,我問了幾個銷售員,他們都說年終生意不太好做,各家都收緊了財務預算,談下的幾家費用也比以前有縮水。我對他們進行了電話拜訪,廠家都說經濟不景氣,希望我們價格方面再放寬點。

人員2:我們12月的銷售額度下降,低於去年同期和今年平均值,可以排除掉大環境的因素。其中A地區下降幅度最大,間接影響了整體銷售額。通過調查發現,A地區的市場因為競爭對手湧入,進行了低價銷售策略。除此之外,B地區的經濟發展低於預期發展,企業縮減投入。

第一個分析思維是依賴經驗和直覺的線性思維,第二個分析思維則注重邏輯推導,屬於結構化的思維。第二種有數據說明,有條理、有邏輯的結構化思維就是我們想要的好的數據思維。但是如果沒有刻意訓練,很多人的思維方式都傾向第一種,以「我覺得我認為」展開。

二、怎麼培養結構化數據思維---《金字塔原理》

那麼怎麼培養結構化的數據思維呢,這裡推薦一本書《金字塔原理》,不過說實話,這本書為了說一個總分總的結構化思維用了很多重複的語言和章節,書寫得不是很好,但是這種結構化思維確實不錯,這種思維也是麥肯錫公司對入職員工培訓標配。

2.1什麼是金字塔原理

因為金字塔是目前為止人類最穩定的建築,它採用是52度角和方錐形的體,金字塔面與面之間的角度是51度50分9秒,這與有「自然塌落現象的極限角和穩定角」之稱的52度角相差無幾,而52度角被認為是最穩定的角,金字塔就是按照這種「極限角和穩定角」來建造的。沙漠的風是暴戾的,由於金字塔獨特方錐形造型,風的破壞力被化解到最小程度。磁力線的偏向作用可以使地面建築,甚至高山崩塌,而金字塔塔基正好處於磁力線中心,它隨著磁力線的運動而運動,隨著地球的運動而運動,因此它所承受的振幅極其微弱,地震對它的影響也就特別小。這種結構可以經歷上千年不倒,為了說明演講表達的結構邏輯性也像金字塔一樣穩固,所以就叫金字塔原理。

什麼是金字塔原理?任何一件事情都有一個中心論點,中心論點可以劃分成3~7個分論點,分論點又可以由3~7個論據支撐。層層拓展,這個結構由上至下呈金字塔狀。

看一下運營中典型的金字塔思維:

我們活躍用戶數在下降(中心論點),主要原因是競爭加劇(分論點),其次原因是新用戶減少(分論點),老用戶流失加快(分論點)。其中競爭加劇是因為競爭對手ABC出現(論據),新用戶減少是ASO排名下降(論據)和渠道投入疲軟(論據)造成,老用戶流失是因為產品欠佳(論據)。我建議……

金字塔原理有四個特徵:

特徵一:結論先行,也就是一個中心思想,一句話說明你要幹嘛?

特徵二:以上統下,通過這句話往下延伸任何一個層次上的思想都必須是其下一層思想的概況,建立一個思想金字塔。

特徵三:歸類分組,每組中思想必須屬於統一範疇,把繁多的內容整理好,MECE不遺漏不重疊,京東,天貓的內容導航歸類,分組就做的非常好。

特徵四:邏輯遞進,每組中的思想必須按照邏輯推進,所有的內容要有邏輯。邏輯推理按照歸納和演繹方式展開,歸納和演繹推理是邏輯學裡面非常重要的兩種推理模式,歸納說的通俗一點就是把共同特徵歸納到一起,例如,前天太陽從東方升起,昨天太陽從東方升起,今天的太陽也是從東方升起,歸納一下,結論為:太陽一直從東方升起。這就是歸納性推理。演繹性推理就是根據一個原有確定的正確假設,然後推導出結論,

我舉個例子,經典三段論

所有人都會死

蘇格拉底是人

所以蘇格拉底會死

所有人都會死,這是一個大前提,蘇格拉底是人是小前提,蘇格拉底會死是結論。這就是演繹推理,就是通過一個大前提,再到小前提,再到結論這樣一個過程。在寫作演講表達的時候,要符合這種推理,不然很難說服別人,聽眾會覺得你邏輯混亂。

2.2怎麼應用金字塔原理

2.2.1找中心論點---假設先行

因為金字塔是從上而下,需要有一個中心論點,也就是塔尖。而新人容易變無頭蒼蠅,就是缺少了一個塔尖、一個中心論點、一個下刀的地方。麥肯錫為了解決這個困擾,提出了假設先行的方法。

什麼是假設先行?就是以假設作為思考的起點。我不需要做全局的思考,而是先問出一個問題,然後思考解決它:我這款產品的特點在A功能嗎?這款產品對用戶們很有吸引力嗎?我的活動如何在朋友圈引發傳播?怎麼讓用戶在活動中更爽?

在做出假設後,引導思維去挖掘分論點,然後分析。比如我希望活動傳播,我要考慮哪些人會傳播,他們是因為利益引誘還是情感觸動?傳播的過程應該什麼樣,方便還是複雜?這樣的分析思維,比堪堪想一個空中樓閣的完美方案靠譜多了

假設抽絲剝繭後的每一個論據都應該能用是或否回答。分析思維和數據分析不一樣,數據分析追求數據的精確度,而分析思維不需要,只要能回答問題,是和否就足夠了。

假設會被否定或者拒絕,我認為產品對用戶有吸引力,但是最後所有的論據,包括留存率、用戶使用時長、功能使用率、用戶評價都是否定,那麼吸引力也就不成立,此時應該修改假設:產品的某一方面有問題,然後繼續畫新的問題樹。

不要害怕修正錯誤的假設,不要尋找事實強撐錯誤的假設。

2.2.2找分論點---MECE不遺漏不重疊原則與萬能公式

金字塔原理有一個核心法則MECE,讀作MeSee,全稱Mutually Exclusive Collectively Exhaustive,中文意思是相互獨立,完全窮盡。它指導我們如何搭建結構。相互獨立,說的是每個分論點彼此應該沒有衝突和耦合,都屬於獨立的模塊。完全窮盡,則是所有的分論點都被提出,不會有遺漏。這一點看上去容易,其實很難做到。

因為我們很難窮盡所有可能,有一個方法就是找萬能公式。

利潤 = 銷售額 - 成本;

銷售額 = 購買人數 * 轉化率 * 客單價;

購買人數 = 地區A購買人數+地區B購買人數+……

地區A購買人數 = 地區A新用戶 + 地區A老用戶;

2.2.3找關鍵的分論點

麥肯錫有句名言:不要妄想燒乾大海。就是指不要試圖對所有因素分析,尤其在數據證明的過程,非常費苦功。

企業利潤的關鍵驅動因素是利潤和成本,用戶吸引力的關鍵驅動因素是留存率。利潤和成本還能再找出其中的細分關鍵因素,留存率也一樣。這才是我們要的。

不論你分析企業的利潤、還是用戶的活躍,只要抓住關鍵即可。因為一款內容產品,80%的內容一定由核心用戶提供;一款電商產品,80%的GMV一定是少部分買買買用戶下單。圍繞核心關鍵因素展開的數據分析,是最有效果的。

三、如何運用結構化數據思維進行數據分析---《精益數據分析》

這部分內容將主要結合《精益數據分析》,該書內容詳實,有空的話推薦可以詳細讀讀。

3.1首先應建立你的指標體系

3.1.1為什麼要建立指標

彼得·德魯克有句名言:if you cant measure it, you cant manage it.如果你不能度量它,就沒辦法管理它。

所謂衡量,就是需要統一標準來定義和評價業務。這個標準就是指標。假設隔壁老王開了一家水果鋪子,你問他每天生意怎麼樣,他可以回答賣的不錯,很好,最近不景氣。這些都是很虛的詞,因為他認為賣的不錯也許是賣了50個,而你認為的賣的不錯,是賣了100。

老王想要描述生意,他應該使用銷量,這就是他的指標,互聯網想要描述產品,也應該使用活躍率、使用率、轉化率等指標。

如果你不能用指標描述業務,那麼你就不能有效增長它。

3.3.2什麼是好指標

好的數據指標,一般有如下的特點:

  • 好指標應該是核心驅動指標。

雖然指標很重要,但是有些指標需要更重要。就像銷量和利潤,用戶數和活躍用戶數,後者都比前者重要。核心指標不只是寫在周報的數字,而是整個運營團隊、產品團隊乃至研發團隊都統一努力的目標。核心驅動指標和公司發展關聯,是公司在一個階段內的重點方向。記住是一個階段,不同時期的核心驅動指標不一樣。不同業務的核心驅動指標也不一樣。

  • 好的數據指標是比較性的。

比較在不同的時間段,用戶群體,競爭產品之間的表現,可以更好的洞察產品的實際走向,比如:「本周的用戶轉化率比上周高」比「用戶轉換率是2%」更有意義。

  • 好的數據指標是簡單易懂的。

如果不能很容易地記住或討論某指標,那麼通過改變它來改變公司的行為會十分困難。

  • 好的數據指標通常是一個比例或比率。

僅僅查看幾個比例就能夠對一個公司的基本狀況作出判斷,你也需要幾個這樣的比率為自己的創業公司打分。

3.3.3什麼是壞指標

  • 其一是虛榮指標,它沒有任何的實際意義。

產品在應用商店有幾十萬的曝光量,有意義嗎?沒有,我需要的是實際下載。下載了意義大嗎?也不大,我希望用戶註冊成功。曝光量和下載量都是虛榮指標,只是虛榮程度不一樣。

新媒體都追求微信公眾號閱讀數,如果靠閱讀數做廣告,那麼閱讀數有意義,如果靠圖文賣商品,那麼更應該關注轉化率和商品銷量,畢竟一個誇張的標題就能帶來很高的閱讀量,此時的閱讀量是虛榮指標。可惜很多老闆還是孜孜不倦的追求10W+,哪怕刷量。

虛榮指標是沒有意義的指標,往往它會很好看,能夠粉飾運營和產品的工作績效,但我們要避免使用。

  • 其二是後驗性指標,它往往只能反應已經發生的事情。

比如我有一個流失用戶的定義:三個月沒有打開APP就算做流失。那麼運營每天統計的流失用戶數,都是很久沒有打開過的,以時效性看,已經發生很久了,也很難通過措施挽回。我知道曾經因為某個不好的運營手段傷害了用戶,可是還有用嗎?

活動運營的ROI(投資回報率)也是後驗性指標,一個活動付出成本後才能知道其收益。可是成本已經支出,活動的好與壞也註定了。活動周期長,還能有調整餘地。活動短期的話,這指標只能用作復盤,但不能驅動業務。

  • 其三是複雜性指標,它將數據分析陷於一堆指標造成的陷阱中。

指標能細分和拆解,比如活躍率可以細分成日活躍率、周活躍率、月活躍率、老用戶活躍率等。數據分析應該根據具體的情況選擇指標,如果是天氣類工具,可以選擇日活躍率,如果是社交APP,可以選擇周活躍率,更低頻的產品則是月活躍率。

每個產品都有適合它的幾個指標,不要一股腦的裝一堆指標上去,當你準備了二三十個指標用於分析,會發現無從下手。

3.3.4怎樣選擇好的指標

第一關鍵指標OMTM(One Metric That Matters)

創業成功的一大關鍵是達到真正的專註,並且形成一套紀律來保持專註。雖然不專註也有可能成功,但那只是歪打正著,你會浪費多得多的時間在漫無目的的遊走上,獲得經驗教訓的過程更加痛苦和艱難。如果創業真的有什麼成功的秘訣,那一定是專註。

在數據分析的世界裡,意味著挑選一個唯一的指標,該指標對你當前所處的創業階段無比重要。我們稱之為OMTM(One Metric That Matters,第一關鍵指標)。

商業模式+創業階段決定你的指標

精益數據分析的核心思想是:得知自己的商業模式和創業階段後,即可跟蹤並優化當前的創業第一關鍵指標。通過反覆實踐這一流程,可以克服許多公司或項目在早期都會面臨的風險,避免過早增長,並最終在真實的需求、明確的方案和滿意的客戶這一堅定的基礎上建立起你的公司。

商業模式是什麼?商業模式是讓人們做你希望他們做並能使你從中獲利的事。為什麼要了解商業模式?因為你的賺錢方式決定了你應關注的指標。從長遠來講,企業風險最高的部分往往是與其如何賺錢直接相關的。在《精益數據分析》這本書中,介紹了六類典型的商業模式:電子商務、SaaS、移動App、媒體網站、用戶生成內容(UGC)、雙邊市場。

每家創業公司都必須經歷多個階段的磨練。磨練過程從發現問題開始,歷經解決方案的創造及其有效性的核查,並以口碑營銷以及資金的籌集結束。在《精益數據分析》這本書中,把創業分成5個階段:移情、黏性、病毒、營收、規模化。

下圖就是《精益數據分析》這本書總結的,將這五個階段和六種常見的商業模式相結合,可以得出不同業務類型的組織在不同階段最應關心的數據指標體系。

3.2如何分析你的指標

3.2.1分析方法

  • 維度分析

談到維度法,想要強調的核心思維是:對比,不同維度的對比,這大概是對新人快速提高的最佳捷徑之一。比如過去和現在的時間趨勢對比,比如不同地區維度的對比,比如產品類型的區別對比,比如不同用戶的群體對比。單一的數據沒有分析意義,只有多個數據組合才能發揮出數據的最大價值。

  • 縱向分析---同期群分析

比較的是相似群體隨時間的變化。產品會隨著你的開發和測試而不斷迭代,這就導致在產品發布第一周就加入的用戶和後來才加入的用戶有著不同的體驗。比如:每個用戶都會經歷一個生命周期:免費試用,到付費試用,最後停止使用。同時,在這期間里,你還在不停的對商業模式進行調整。於是,在產品上線第一個月就「吃螃蟹」的用戶勢必與四個月後才加入的用戶有著不同的體驗。

每一組用戶構成一個同期群,參與整個實驗過程。通過比較不同的同期群,你可以獲知:從總體上看,關鍵指標的表現是否越來越好了。

下面是一個案例

  • 橫向分析---A/B測試與多變數分析吧

橫向研究指在同一時間段對不同被試群體提供不同的體驗。例如:向半數用戶展示一個綠色鏈接,對另一半用戶展示藍色鏈接,觀察哪種顏色的鏈接點擊率更高就是一種橫向研究。

A/B測試:假設其他條件保持不變,僅考慮體驗中的某一屬性(如鏈接的顏色)對被試用戶的影響。

多變數分析法:同時改動產品的多個方面,看哪個與結果的相關性最大。

你可以測試產品的所有細節,但最好首要關注那些關鍵的步驟和假設。A/B測試的結果會為你帶來巨大的回報。眾籌公司Picatic的創始人之一傑·帕瑪對此深有體會。他將用於觸發訪客行為的「立即試用產品」鏈接文字從「免費開始」改成了「免費試用」,僅僅這一簡單的改動,就使鏈接點擊率在10天之內飆升了376%。

A/B測試看似簡單易行,實則有一個軟肋——只有用戶流量巨大的大型網站(如微軟必應、谷歌)能對單一的因素(如鏈接顏色、網頁速度)進行測試並迅速得到答案。如果沒有龐大的用戶流量,你將需要測試很多因素。這可能包括網頁的色調,觸發用戶行為的鏈接文字,圖片效果等。

  • 機器學習

機器學習一般要用到建模,需要編程,這部分內容相對較多,後期再聊。

3.2.2分析步驟---精益數據分析循環

精益數據分析循環是用來測量的一個簡單的四步驟流程,它展示了如何應用精益數據分析來改進我們的業務。

Step1:確定改進點

首先要弄清楚企業想要改進什麼,前面我們已經說過了,結合當前的商業模式和創業階段,可以選擇一個關鍵數據指標,並為該指標確定目標值,來衡量是否達成預期結果。

目標值的獲取有兩種方式:A:自主設定目標值;B:參考行業基準值。

例如,在進入規模化階段之前,「月用戶流失率」應該降到2-5%以下;在進入規模化階段之後,「周用戶增長速度」應該達到5%,等等。這些都是矽谷眾多創意精英總結的寶貴經驗。

Step2:形成假設

這是發揮創意的地方,找出提升這一關鍵數據指標的增長策略。

如果沒有數據,那麼可以嘗試任何可能的方式進行直覺猜想,比如:試著了解市場、從競爭對手那裡模仿、使用最佳實踐、閱讀公司發展業務的方式,從增長黑客到內容營銷,並將其用於啟發靈感。

如果有數據,那麼找出那些正在做你想做的事的人有什麼不同,找到模式,比如:如果試圖降低用戶的流失率,就找出那些一直都不會退出的用戶。他們有什麼共同點?他們都來自同一個地方嗎?他們都買同樣的東西嗎?

無論哪種方式,假設都來自你的用戶的頭腦中。「假設」一詞有很多不同的解釋,維基百科的定義是:人們將問題的試驗解決方案稱為假設,通常稱為「有根據的猜測」,因為它提供了一個基於證據的解決方案。

Step3:創建實驗

根據假設,設計實驗,對數據指標進行驗證。

在驗證是否達到預期的結果或去驗證預期的假設時,比如:想改進註冊頁面的轉化率,改進的方案是調整註冊按鈕的位置,如何知道註冊按鈕是放在頁面左側轉化率高還是放在右側轉化率高呢?這時可能就需要用到A/B測試等常見的數據測試方法。

Step4:測量,並決定要做什麼

根據測量結果,作出決策,你會知道實驗是否成功。

可能會有如下幾個選擇:

如果試驗成功,你將找到一個可持續、可複製、持續增長的商業模式,並且學會如何迭代它。

如果試驗失敗,我們需要重新審視我們的假設。記住,只要你從中學習,失敗永遠不會是一個「浪費」。

無論您對用戶有多少了解,或者您擁有多少數據,精益數據分析循環的核心都是快速應對變化。它不鼓勵等待完美的數據或完全理解每個變數,或完全理解企業正在努力解決的問題。重要的是要注意,整個精益數據分析循環和精益創業模型並不是在提倡混亂。他們可能會處理不確定性,但他們不是隨機的。

你是否在公司內部遵循一個結構化的流程來確保數據驅動的決策一直在不斷進行?如果您要應用精益數據分析循環,哪些挑戰可能會導致公司內部出現問題?或者會做出什麼改進?

課後練習:針對你所在的公司或者你想去的公司,選擇一種業務場景,構建你的指標體系,並思考分析的步驟。


推薦閱讀:

今日數據行業日報(2016.12.13)
我們每個人都只是一堆數據,想到後直接整個人鬱悶了!
帶你認知什麼是大數據!!!
可視化情報分析平台
sqoop簡單介紹

TAG:數據挖掘 | 大數據 | 數據分析 |