什麼時候覺得,數據分析真的非常有用?

雖然數據分析的重要性在今天異常凸現,但是對於很多人來說,數據分析還是沒有發揮真正的價值。想在這裡跟大家探討一下,什麼時候覺得,數據分析真的非常有用?


這是一個關於公司政治和數據的故事。這兩個看起來毫不相關的概念,因為數據分析的精彩而解決了公司政治的複雜。

一、新官上任三把火的前戲

2005年,我司接到某國際大公司的項目,助其規劃呼叫中心戰略。說是「規劃戰略」,其實是給新上任的呼叫中心負責人提供政治彈藥。俗話說新官上任三把火,面對在線客服這種純成本中心而不容易出成績的部門,新來的負責人為了儘快做出令人矚目的突破,可謂是相當激進和勇敢:誓要改變呼叫中心的流程,同時達到省成本和提體驗兩個本就是互相違背的目的。

他的戰略是兩手。其一,通過菜單優化和簡化,提升IVR體驗和加大IVR服務比例。

IVR(Interactive Voice Response),自助語音菜單

其二,人工服務學習歐美醫療的分診機制,在最前端設立一個「分診客服」,當用戶第一次接觸人工的時候,了解用戶需求之後,迅速把用戶轉接到合適的IVR服務或者「專業客服」,由他們提供更專業更精準的服務。

以今天的視角來看,這位領導非常之超前,首先是用機器替代人,只不過是叫IVR,不好意思叫AI;其次是,專業化分工和流水線作業;最後,通過簡化產品來提升用戶體驗,有那麼一點蘋果Home鍵的極簡思路。但是用在12年前的這個時候,這樣的超前戰略布局把大部分人都嚇尿了。啥?原來的上百個菜單要砍到幾十個,雖然那些菜單很不常用,但是用戶找不到投訴怎麼搞?用IVR替代人是個什麼鬼東西?專業化分工客服怎麼搞,分診客服和專業客服能配合好嗎?

新領導的手下們紛紛「冒死進諫」,希望步子小點閑著蛋,可是雄心勃勃的老闆雷厲風行準備立即開干。大家憂心忡忡擔心各自烏紗之際,某位老江湖獻計:「老闆,這個鍋可以讓人來背嘛。我們小範圍試行您偉大戰略的過程中,引入一家國際知名戰略諮詢公司在一旁幫我們做優化和評估。首先,我們可以及時完善您的偉大戰略,讓偉大更加偉大。其次,如果時運不濟,我只是說如果和假設,您的戰略在實施過程中遇到小麻煩,那也是國際知名諮詢公司都論證無誤的方案,純粹是個意外,我們也沒有責任。」新領導大老闆聞言大悅道,「老司機,就這麼上車吧!」

以上情節和對話純粹為腦補,如有雷同純屬意外。

於是我們諮詢團隊就這樣被一個大合同砸中了頭然後匆忙上陣。考慮到當年的那種數據基礎和技術手段,我們很快就犯難了,就這點通話量等宏觀數據,搞不出啥方案評估的結果來。頂多只能找市場調研公司發問卷,定性定量得問問用戶體驗如何,打個分和之前的服務相比如何。稍微懂行的人就知道,這個調研是一件非常扯皮的事情,存在著樣本選擇、問題設計以及提問引導等等各種可以隨意更改最後結果的環節。而我們諮詢團隊的領隊也是老司機,深知甲方的項目背景以及需要什麼樣的結論,這種海森堡測不準的事情,我們除了順著客戶說同時在其中找出幾個增值點,也就算滿足客戶需求了。即使不順著甲方之前的建議來說,作為我們唯一調研方案的用戶調研,從方法論到實施過程都是千瘡百孔,也經不起用戶調查。

二、不服輸的數據愛好者

眼睜睜,這個項目只好甲方乙方「沆瀣一氣狼狽為奸」糊弄過去。可是可是,那些年那些兔,我還是個非常年輕的技術男,非常不甘心這樣,最後站出來告訴老闆:希望以市場調查為輔,以純數據分析為主;定義可量化的目標(成本和服務質量),全程埋點監測用戶路徑,AB測試……這些當前看似習以為常的術語其實在12年前,許多都還沒有專屬名詞。萬幸的是,我老闆是畢業於美國名校的生物大牛PhD,一聽這套思路尋思聯想到自己曾經搞的各種雙盲測試結合,非常開放得讓我一個人帶著兩個實習生放手去嘗試,剩下的人走市場調研的老思路。

第一步是定義目標函數。

  • 什麼是成本,每天的話務量和客服人數都有波動,單看來電量或者接通量肯定有誤差。最後是通過看單位成本來衡量,單位成本=人工服務時長/所有的有效撥叫用戶量。有效撥叫用戶量利用來電號碼去重。

  • 什麼是體驗,話務量和客服人數的波動會影響體驗,單看等待時長或者接通率肯定有誤差。最後是通過反覆撥叫客服用戶的佔比來代表體驗,因為反覆撥叫客服的用戶,證明第一次沒有接通或者進入呼叫中心後問題沒有得到解決而需要重複撥打。

指標定義清楚之後,接著按照下圖把各類數據定義清楚,然後在所有可能的地方生成日誌以便產生所需的數據,按照當下的術語叫做「埋點」。

在收集到含有所有這些數據的日誌之後,進行數據清洗和結構化,最後建立邏輯樹(Logic Tree),當然按照現在的術語叫做金字塔模型和漏斗模型。比如:人工服務總時長=人工服務單位時長x人工服務話務量,人工話務量=總話務量x(1-IVR服務比例%),總話務量=發起話務量x接通率,發起話務量=有效呼叫用戶量x人均呼叫次數,等等。

繪製出用戶的詳細軌跡,找出整個流程的瓶頸。

繪製出按操作時間的比例分布圖,對用戶行為進行詳細的拆解和分析。

繪製出IVR菜單的轉化漏斗,對IVR菜單設計合理性進行詳細分析。

最後設計分流措施,達到AB測試的結果,有純隨機流量的AB測,也有弱一些的按地域分開的AB測,方便結果之間的對比。

三、Data is the new sexy

如果說結果是無可辯駁有點誇張,但是純數據的方式非常有說服力。一方面驗證了大領導的遠見卓識,一方面也從實施角度找到若干風險點幫助大領導優化執行節奏,而這些建議都是依靠傳統的市場調研無法獲得的。比如:

  • 新流程雖然降低了平均人工服務時長,實現了大領導的重要目標,但因為分診客服的操作不熟練,分流不精準而不能解決用戶需求,讓重複撥打的用戶大幅提升,最終反而提升了總人工服務時長,同時降低了服務質量。對症下藥就是提升分診客服的熟練度,以及將解決用戶需求的IVR菜單拆分得更原子化以便更精準得解決用戶需求。
  • IVR菜單根據漏斗模型來優化菜單,重點是降低菜單的寬度和深度。基於用戶路徑的分析,進行許多微觀層面的改進而把用戶來電儘可能得引導到IVR服務,比如:把占最大比例的查詢話費餘額放在首層菜單的首位;對一些下行比例很低的菜單進行刪除或者調整;強制用戶在聽完第一層IVR菜單後才能跳轉到人工服務等等。

最後我們的結果震撼了客戶以及大老闆,雖然有忠言逆耳的部分,但是在認可他的大方向的同時,又用難以辯駁的數據和方法論提出了戰略執行中若干需要把握節奏和提升體驗的細節,其實幫助他更好地實現其戰略和收穫不一樣的成績。

數據分析,讓我們不用違心的人云亦云,也不用以給客戶做槍的方式來獲得回報,這一種很好的站著把錢掙到手的方式。

…更多文章請到數據冰山 - 知乎專欄

…更多回答請看何明科


1、

09年我在做汽配零售批發,除了自己負責的門面,還兼管公司的華中物資庫。

華中物資庫總貨值大概在800萬左右,寄存在一座倉儲物流里。

這是不正常的,我司麾下有鄂湘閩贛豫五個區域,每個省每月大致銷售80-120萬貨值,絕大部分貨直接從廠家補充到他們那。從月報表上分析,完全沒必要囤這麼大量的應急物資,而且上一任也囤錯了貨,明明有些不是這五省的暢銷款啊!

就給它做了減負。

(汽車配件跟其他商品不一樣,它有地域屬性,每個省的暢銷車品牌結構完全不一樣。原因:4S店覆蓋率和地方保護,譬如計程車選用、價格補貼、省份親切感、市場培育。)

經過調撥、跟友商置換減到了500萬貨值,公司一下多了300萬現金流...

倉儲物流費用每月也降了不少。

2、

我轄區有兩家較大的分銷商,突然有一個月Y不怎麼進某貨了,競品也沒調價,我師傅看完報表左右覺得不對勁,立刻著手調查。

原來Y用高薪挖了上游公司裝配員工,自行採購零部件做起A貨...

礙於有長期合作的情份沒舉報。

師傅立即從廠家調了一批較便宜的子品牌,喊我做市場培育,就為了在市場上懟他。一番商戰,Y重歸麾下...

雖然不知道Y造的A貨品控怎麼樣,反正沒讓他坐大。

3、

11年我到了該配件的上游公司做業務經理,外派保定,服務於長城汽車。

我上任的時候,長城C30款轎車每天生產450台,這種汽車公司都實行雙軌供貨,我們與競品按55比例為長城供應配件。

也就是每天供應210-240台。

(每30台一個物料車。)

每家大公司都很講究庫存管理的,大家熟知的案例有蘋果,換代之前基本上會把舊型號配件消耗殆盡。汽車零配件更講究這點,算上下游,其實有近乎一個多月的汽車零部件庫存,處於被採購的原料狀態或鑄造成型中。

整個供應鏈滯銷不起。

所以我們會在保定備3天當地庫存,2-3天在途庫存(汽運載貨量,按需發貨,一天到達),和3-5天的異地庫存(離保定1000公里外的我司倉庫)。這是按汽車廠每天消耗100%份額算的,防止另一家掉鏈子。

源源不斷生產,源源不斷的運送,但把庫存控制在了合理範圍內。

偶遇冰雪天氣、配件產能問題,導致長城生產線無法生產是會開巨額罰單的!幾乎是以停產時間內,該車型整車所能產生的利潤計算!耽誤一小時都特么巨款啊,所以我對進銷存特別上心,一個疏忽都不敢有。

後來長城C30暢銷了,每天生產近600台車。

按照老規律,汽車市場下半年會是旺季,我和上司擔心公司產能會不足,顧不上我們這塊的生產,就提前催了一大批庫存。

剛一到貨我就發現長城連續調了兩天360台配件,占份額的60%,對接的商技科工程師還問庫存充不充足,我馬上意識到競品出了問題!

他們產能不足!跟不上長城C30的提量!

立刻彙報上司,聽他指示聯手向我司內部施壓,讓我司採購派人到下游公司盯緊生產,增加模具數量,擴大該型號的生產規模。

跟我司生產線負責人、倉庫、物流、總經理都反覆打好招呼,必須配合好這一場供銷仗...

不許出差錯。

上司當天非常老辣地趕到長城商技部、採購部聊起了競品產能不足,我司洞察到了這一點並做好了提產準備。

「您看,是不是就按60%比例繼續走下去!?機會都是送給有準備的人的,我們可不會像XX他們那樣掉鏈子,那樣對長城公司實在太危險了。我們XXXX一定要陪長城公司打好提產這一仗!!!」

然後...

我們就一直在這個車型佔60%份額了,雖然在長城那是10%的份額調整,但從我司看其實增加了20%銷量啊!

都特么是獎金啊!同志們!

4、

就像 @路人甲 說的那樣,高贊答案都是有規矩可循的。15年7月剛來知乎那會兒,發現朋友十萬多粉,我覺得很有范兒啊!專門花了7天分析領悟精髓,三個月獨立達成萬粉。

這算是一種樂趣吧...

每一個數據都值得認真對待,尤其是差到極致的那部分。

是軟肋,也是自身潛力的突破口。

——————

有人私信問我還分析過什麼經濟相關的。

這方面感悟寫的很少哎...

也沒有建模。

兔撕雞大老爺:為什麼人們常說「十個創業九個死」?

兔撕雞大老爺:如何評價「發改委:網店確實衝擊了就業」?

經濟分析類答主推薦關注這幾位:

@慧航 @溫義飛 @馮晗 @chenqin @團支書

謝謝閱讀。


美國某信用卡公司,曾經有兩名數據分析師,利用公司內部的信用卡交易信息來分析別的公司的發展狀況,比如通過信用卡在快餐店 Chipotle 的刷卡量來預測後者的發展狀況,從而在財報出來之前大加槓桿賭會漲或者跌。

兩位數據分析師在短短兩年之內從十幾萬美元開始,賺到了兩百多萬美元,也有說賺到四百多萬的。

當然最後 SEC 還是發現了,把兩人告上了法庭,罰了一千三百萬美元。

https://www.reuters.com/article/sec-capitalone-insidertrading/ex-capital-one-data-analyst-goes-on-trial-for-insider-trading-idUSL1N14R2BP20160111

https://www.reuters.com/article/us-sec-capital-one-fin-insidertrading/former-analyst-for-capital-one-must-pay-13-5-million-for-insider-trading-sec-idUSKCN0VZ2TW

我認識個朋友,相比之下就弱多。

大概五年前,佳能推出全副旗艦機 1DX,消費者非常期待。

然而因為日本地震的緣故,產能出現了問題,貨源跟不上。

我的這位朋友,當時還在念生物博士,通過分析 eBay 上的成交記錄發現,有一個商家在不斷的收購上佳能上一代旗艦機。

試賣了幾單之後他發現,這個商家連 $7000 一台都收,而之前正常價格大概在 $3000 出頭。

於是這位朋友在 eBay 等各個網站各種方式買了幾十台,都倒賣給這家店,賺夠了學費,然後就博士退學,轉去念數據分析的學位了。

畢業了之後到現在還干著數據分析的工作呢。


感謝 @張溪夢 Simon 邀請,數據分析這一年來對我的幫助十分之大,我來說一說數據分析對我在知乎上的幫助。

自從我的知乎讀者到達十萬之後,我經常會受到各種私信問我為什麼能有這麼多讀者,有什麼小技巧可以分享,我經常給到的回復是:數據分析。我的知乎能在一年多時間裡從零到十五萬是我一步一步分析到實踐的結果,那麼簡單來說一說我從哪些方面做的。

1.經常分析研究精華回答

精華回答就是知乎社區或者話題下贊同數量最多的回答,答案贊同越多答主曝光率越高,那麼被關注的機會就越大,那麼如何寫一個高贊精華回答就很重要,如何寫高贊的回答?把擅長的話題或者知乎的根話題下所有精華回答拉出來,拿一個筆記本對每一個回答做歸類做分析,學習高贊回答的文風、思路,對我來說收穫非常大。

當然,並不是所有的高贊回答都會增粉的,那麼這些就是需要結合具體的回答以及回答者的漲粉情況去慢慢分析琢磨了。

2.經常分析研究漲粉快的用戶

有很多小夥伴都知道,從今年年初開始,我每個月會固定抓一次知乎粉絲過萬的所有用戶,並且做用戶的粉絲增長數量和速度排名,這些有什麼用?可以拎出每個月粉絲增長數量前十或者二十的用戶進行分析,他們為什麼漲粉?有什麼我可以借鑒的地方,當然有很多東西是不可複製的,也是不能複製的。

3.什麼時間發什麼內容?

在第一點的時候我說到高贊回答是增粉最快的手段了,就像微信公眾號一樣不同的時間發文章閱讀量會不一樣,因為這和平台用戶的活躍時間有關。

通過對知乎的數據的監控分析,我知道了大部分知乎用戶在平常的時候每天的早晨九點到十點半會活躍並且容易點贊,在晚上的九點之後容易活躍並且點贊,在周末的時候用戶容易在下午的三到四點點贊,當然遠遠不止這些,對此我以前做過一點解釋:路人甲:為什麼知乎的眾多答主答題後獲得的贊是在「一覺睡醒」後才發現的呢?

通過不斷地測試分析我發現在計算機領域,早晨八點鐘發回答或者文章一天下來點贊數量比其他時間段發表好,在晚上的時候發表娛樂相關的內容效果比較好。同樣我發現我的讀者特別喜歡在我早晨發表回答的時候點贊,下午的時候我的重度讀者幾乎不在刷知乎。

數據分析對我的幫助遠遠不止這些,更多的時候她能幫助我看清很多東西,包括但不限於:

1.通過數據我能發現電影是否有水軍:豆瓣5.6分的《西遊伏妖篇》評論有水軍嗎?

2.通過數據我能判斷知乎Live質量:不交智商稅,如何判斷一場知乎live的質量?

3.通過數據幫助業務人員發現一些他們發現不了的東西:大數據對物流管理有什麼影響?

4.克服我的選擇困難症,用大眾點評數據幫我選合適的餐廳:約會聚餐如何正確選擇餐館?

5.用新浪微博數據揭露華為海軍的真面目:路人甲:如何評論華為官方對快閃記憶體事件的回復?

當然,數據分析最重要的時候,是每個月發工資的時候…


講個段子:某日一夥年輕人吃飯,一個哥們說自己買了很多蘋果充電線,每個屋子都插一根這樣自己在哪兒都可以玩兒手機。其它人聽了紛紛表示不屑並建議為啥不直接買個充電寶,只有一個妹子在飯後問他買了幾根充電線。一年後,兩個人收著北京七八套房子的房租快樂生活。


感覺好多人吐槽說那會買房哪都能賺 (*≧▽≦) ,這話沒錯的。我在原答案也寫了,預估16年房價會上揚,但這個是根據整體判斷的,不是分地區。那我為什麼還要在地段上死磕,隨便買不就是了?因為我認為把房子掛出去賣和真正成交是有區別的,不單單是為了贏利,我還要確定未來這套房有很多人願意買,這樣才能轉手。我們都知道很多人賺錢速度跑不過房價上漲,也意味著未來能接受的人會變少,但只要房子夠好,一定會有人買。所以我原文寫到了做房產需求的地圖,租和買都做了,你們知道北京南北房產的需求差了多少嗎。我後來的劃區域主要也是為了這個,我們划了小半個北京,最後定在了東四環。對房屋物業的品質要求也是為了這個原因。至於說房價漲幅,我的確沒做區域對比,原文也說了問題。主要這個怎麼也需要監測段日子才能下結論,問題我又不是工作,我人又這麼懶.....( ̄□ ̄;)

以下原文:

--------------------------------------------

15年幫同事買房,同事自己有房,這套是買來投資的,預算140萬,持有幾年後是要賣掉的。

所以我當時給他設定的思路是,第一要好租,第二要好賣,因此這套房不能太偏,戶型不能過大,物業要好,品質要高,70年產權,這樣可以保證後續轉手有接盤俠。

過程就是,上網,用爬蟲爬出最近一段時間北京各區域小區房價數據,做數據清洗,畫出房價地圖。當時我們本身在互聯網房產相關領域,能查到自家租房和買房流量數據,某種角度看也代表各區域的租買房的需求數據,時間為近半年,同樣畫出房產需求熱力地圖。再上網查出北京未來地鐵規劃以及現在的地鐵站人流量分布,這四種區域數據合併做分析,划出未來房價能穩中有升並且好轉手的地區。

再扒出近一年北京存量房成交量數據,最近一年房地產政策發布內容,順便翻了下北京人口凈流入數據,又看了下存銷比神馬的,時間有點久記不住了,反正是這些東西,基本能估計出16年價格能有明顯上揚,當然我也沒意料到後來能上漲那麼多。當時畢竟我是給他提建議,所以為了負責,額外做了這些預計的準備。

做完這些,再反過來看之前扒過的房價數據,找出地區價格合適的房子,看戶型圖,順便我自己還簡單學了下房屋進深,面寬的比例和動線什麼的,考慮了下面積,單價數據,圈定具體樓盤的某個戶型,然後他去看房,不知道一般人看多少套房才會買,反正他應該沒在看房上花太多時間,最後評定的時候我們甚至連觀景都考慮進去了,但面積不大,40多平的開間,單價4萬1,算是這個小區最低單價了,實際支付大概170萬。

3個月後,同戶型報價上浮30萬,漲到了200萬。近一年後我又問他時,他說同戶型報價已經到了340萬,翻了一倍,當然實際要看成交價,不過他怎麼都會賺的,現在賣沒賣就不清楚了。

如果從數據分析項目角度來說其實還沒做完,因為我後來在沒關心過別的房子和地區的變化,無法橫向比較,但考慮到這種房子出租空窗期會很短,也算變相收益吧,說白了就是我沒做復盤。

不過其實現在想來,我當時做的東西,最大的效果應該是堅定了他買房的信心了吧。也算欣慰,畢竟,數據有時就是為決策做依據的。


我休假的時候。

公司運營的同事告訴我,他們花了一百萬來買用戶刷量。

第一筆費用是20萬,一個用戶5塊錢,手機號+身份證。

我的第一反應就是不對。

之前我設計的「戳紅包」活動,一周傳播了5萬人,轉換的註冊用戶,差不多是50塊錢一個(獎勵金,P2P平台,要取出來,需要先投資)

不過出門在外,也沒多想,世上能人很多,也許總能找到一些合適的渠道。

回來之後沒事幹,統計了一下註冊用戶的屬性,想看一下多少人註冊,年齡多大,多少人購買,金額多少,復購率怎麼樣。

發現了一個很奇怪的問題,這些新人註冊的時間間隔很怪,固定間隔,沒怎麼變過,0購買。

一個人都沒有。

這百分百不正常,顯然是刷單,而且是無效的。

可是要這麼刷單數據有什麼用?

老闆並不相信我。

嗯。

或者說,並不認為讓我持續做紅包的運營活動比這種買用戶的行為更有用。

紅包活動本身有一個流量清洗的過程,所有拿到獎勵的用戶,都必須是要在官網投資一輪,然後才能取現。

所以本質上來說,用戶已經感受過了一次平台的支付和購買過程,已經有體驗。

如果客服團隊後續無法轉換,那是另外一個問題了。

總有羊毛要送人,但是終歸是要有轉換率的。

可是老闆並不懂的所謂的刷單是什麼含義。

我猶豫了很久要不要跟他說這件事。

嗯。

後來聽到客服團隊打電話的時候,一個成單的都沒有,能打通的都比較少。

100萬的後續不知道還買沒買,反正後來我是離職了。

至少20萬,又或者是當初的100萬。

就這樣。

我想大概運營的同事們也不懂什麼是刷單,畢竟剛從線下轉線上,很多人都沒這種概念,基礎知識科譜了很多次,也找不到更合適的人做運營。

如果沒有那天晚上我偶爾心動手動統計了一下數據(數據分析平台還沒建好),大概也許要過很久他們才能發現這些單子全部是刷的。


數據分析貫穿了運營工作,不了解數據的運營不是好運營。

如果我們需要總結一下的話,簡而言之,數據對於運營的價值可能包括了如下幾方面——

1.數據可以客觀反應出一款產品當前的狀態好壞和所處階段。

比如,三節課定位的用戶群主要是互聯網行業的產品經理+產品運營,這群人假如有300萬人,目前我們已經有了10W用戶,且依靠口碑形成的自增長還比較迅速,那麼我們是不是應該去加大一些推廣和營銷的力度,把推廣做得更好一些了?

又或者,假如我們現在才只有1W用戶,且課程等產品體驗還比較一般,那其實我們當前的主要核心任務是不是更應該是先節奏慢點兒,踏實把產品體驗搞好了再說?

2.假如做完了一件事但效果不好,數據可以告訴你,你的問題出在哪裡。

比如,三節課新做了一個圍繞著課程推廣的活動,但結束了之後發現真正願意去參加課程的人不是太多,那你是不是該去看看,到底是引流引得不夠多,還是課程頁面轉化率太低,還是整個報名流程有問題

3.假如你想要實現某個目標,數據可以幫助你找到達成的最佳路徑。

這個好比你老闆讓你要把銷售額提升5倍,你是不是得去看看,銷售額的提升到底該從哪裡來更合適?是搞進來更多流量?還是用心把付費轉化率做上去?還是好好提一下客單價?或者老闆要的是用戶量提升50萬,你是不是得去看看,這50萬用戶從哪裡來更靠譜?多少可以來自於用戶口碑和自增長?多少可以來自於網盟?多少可以來自於豆瓣小組新浪微博?

4.極度精細的數據分析可以幫助你通過層層拆分,對於用戶更了解,也對整個站內的生態更有掌控力。

比如,三節課站內這麼多課程,我們是完全可以通過數據得到以下問題的答案的——從課程的層面來看看,到底什麼樣的課程更受大家喜歡?然後,大家聽課的習慣是怎樣的?是喜歡同一堂課認真聽很多遍?還是一堂課只聽了3-5分鐘就走掉了?再然後,一個還沒畢業的大學畢業生和一個已經工作了2-3年的互聯網從業者,雖然同樣都是想要學習,但學習習慣和訴求是不是應該是有所不同的?以及,假如我們想要盡其所能的服務好三節課的全部用戶,我們是不是可以把這些用戶劃分為各種不同的類別,然後分別推送給他們不同的課程和學習內容,引導他們去完成各種不同的用戶行為?

5.數據當中可能隱藏著一些潛在的能讓你把一件事情變得更好的線索和彩蛋,有待於你去發現和挖掘。

好比,在三節課的用戶群中,我們要是通過數據的分析發現了這樣一個結論——在過去1個月內,但凡是跑到三節課來報名上課的用戶,70%都是因為看了我們的某篇文章才跑過來的,這時候你覺得你應該做點啥?

毫無疑問,當然是把這篇文章放到首頁顯眼處,或者放到新用戶註冊或訪問過程中的某個必經節點上,用它去刺激更多的新用戶啊!

那麼,假如你做完了一件事但效果不好,這時如何通過數據來界定問題到底出在哪裡?

我們來看一個真實的例子:

某O2O課程學習平台,註冊用戶5W,模式為用戶通過線上付費報名,線下實地上課,日前上線了一個專題,聚合了6堂課程進行打包推廣,預期每堂課至少報名40人以上,但從結果來看,效果不佳。該專題頁相關數據如下(看不清可點擊放大):

現在,我們想要知道這個專題的具體問題到底出在哪裡,請問該怎麼做?注意,這裡建議你可以自己先花點時間動動腦子思考一下,有了一些自己的判斷和結論後,再繼續往下看答案會更好。

這裡要就要提到我們曾經在《連載2.6:想成為年薪30W+的運營,你必須具備這4個「運營思維」》里提到的4個「運營思維」的其中之一了:流程化思維。也即是說,要先梳理清楚流程,再來流程來反推問題的所在。

比如說,圍繞著一個課程專題的運營,其觸達到用戶的整個流程大體應該是如下這樣的:

於是,我們可以依據這個流程回過去看,到底整個專題的問題出在哪裡?比如說,是推廣本身不給力?還是推廣到專題頁的轉化率太低?還是專題頁的跳出太高,基本沒人進入到課程?又或者是課程頁面到報名的轉化太差?還是說報名後的訂單確認和支付流程流失掉了太多的人?

以及,如果我們已經界定清楚了,以上幾個大環節中的某一個環節存在問題,比如說,我們已經發現了推廣到專題的流量數據太差,那具體又是什麼原因導致的?是因為我們去到鋪得太少,還是因為渠道執行力度不夠?還是推廣素材和文案太差?

如果按照以上的思路來對於這個專題的數據進行分析,我們可以發現,該專題的問題可能主要出現在以下幾方面——

1.專題頁的整體UV就很差。累計1000出頭的UV對於一個專題來說實在是太可憐了。而具體的原因,可能包括:

1)專題上線時間太匆忙。可以看到,8月3號就要開課的專題7月31號才上線;

2)專題推廣不是特別給力,具體是鋪設的渠道不夠,還是在特定渠道內沒做好執行,這個可能需要進一步具體去看每個渠道的具體流量構成和結合執行情況來進行分析了。

2.專題頁的效率普遍較差。一方面是其跳出率超過40%,另一方面則是從專題頁導到單堂課程的UV,最多也不過187,僅相當於專題頁流量的10%左右,這個效率還是低得有些可怕的。

3.從單堂課程的層面來看,課程3對用戶的吸引力可能比較差(報名和課程頁訪問都很少),課程4的課程詳情頁或定價等可能有可以優化的空間(訪問很多,報名很少),課程6則是報名轉化率還不錯,但目測整體在站內得到曝光的機會比較少。

走完了這個例子,是不是感覺數據真的可以幫助我們把問題界定得無比精細,讓我們言之有物目標確鑿?

好的運營是一定會根據數據來指導自己的運營工作,對於運營而言,數據的作用不容忽視。

想學習更多產品運營知識,歡迎關注三節課(微信公眾號ID:sanjieke01), 一所互聯網人的在線大學。


數據分析比如提升留存、拉新、銷售額增長這些咱們暫且不談。

咱們換個視角,讓管理層覺得數據分析有用其實是個非常難的事情,這代表著你要拿數據分析的結果挑戰他們多年積累下來的工作敏銳性。所以說一部分傳統企業在運用數據上是持保留的態度,就算大Boss很有數據Sense,但是他下面的老總們沒有,或者抗拒,其實你很難把數據分析推廣開來,就算數據分析驅動了業務增長了,到底是業務部門的功勞還是數據部門的功勞,很難說得清。

這裡我來分享個故事,故事實現以下四個問題點。

1、如何把數據分析推廣到各個業務部門;

2、用什麼策略開始讓業務重視數據;

3、如何數據驅動業務增長,並且讓老闆覺得這就是業務部門和數據部門共同做出的成績;

4、如何培養企業數據文化。

當初我和我的小夥伴Beauty兩人因為做金融模型非常好,CEO把我調回了集團總部的信息中心。

兩百多人的IT團隊,裡面有個大數據研發組。信息中心平行的還有個數據中心,老闆的女助理管著。

面對這種前有狼後有虎的工作環境,我和beauty就像小兔子一樣瑟瑟發抖。CEO把我扔過去就不聞不問,CTO非常忙,沒太多時間管理我這個「外來人」。

沒有任何工作安排,沒有具體業務,沒有KPI指標,沒有部門。身邊工作的都是一堆對我黑人問號的程序員。

我和beauty兩人一方面還做著金融的工作,但是覺得不行。我必須在總部佔有一席之位。

我給自己兩人部門擬定了「商業分析組」,人事的組織結構並沒有這個組。大家問我做什麼的,我說我做數據分析。大家接著問那你應該在數據中心呀。

我笑了笑,「你們覺得不好記的話,就叫我們BI吧」

那時候沒做任何項目,就是天天寫PPT找CTO彙報,CTO有時間就給我提提意見,但更多的是給我空間,讓我自己玩。

我找過很多業務中心的老總,有些避而不見,有些總監直接說「我憑什麼花一個小時跟你一個小小的工程師說業務知識,我能得到什麼。」我說我可以做數據分析幫助到業務發展。「不用了,我現在下面的人就會做數據分析」

我喵了一眼看他們導出報表,在excel畫畫圖做做統計報表。

原來他們理解的數據分析是這樣啊。

有一天我跟我的前領導聊,他正好跟我談到說他約了一個業務中心的老總,回他微信馬上要見他了。我眼淚直接掉下來,第一次崩潰大哭,我說我約了四次微信,就是不回復我,我以為她沒看到。

從那刻起,我重新梳理所有思路,必須要有一套打法,從上往下是不太可能了。從下往上也不可能,那就從中間吧。哪個部門最需要數據分析?

運營?電商?營銷?項目」

不不不,這些都有專門的數據分析人員,我在不了解業務之下,我怎麼可能替代。

想到了一個部門,督查中心,這個中心是審計財務、運營、營銷等業務與職能部門的不當違規操作。我找了督查中心,做了自我介紹之後,我直接坦白:「X總,你現在在抓各個業務部門的違規操作,肯定需要數據吧,而每個部門的數據都是他們提給你的,你的人員不多,從這麼繁瑣的數據中找到問題,還要論證問題應該蠻累,而且萬一失誤,沒瞄準,那就得不償失了。BI想跟你合作,做了你的槍,咱們用數據分析快速發現問題,這些數據都是從資料庫數據呈現在數據平台上的,你每天都能看到的。那為什麼我想找你合作這件事呢,是因為我剛到總部,我要做出成績,你也想做出成績,咱們可以試試看」

督查中心的總監本身就是一個很有想法的人,然後一聽到我這麼開誠布公,又是幫他幹活,立馬就來了興趣。

於是就開始合作了,沒想到這把槍指向的是財務中心,當時做了多維度的應收帳款模型,使財務中心發現問題後,第二周的應收帳款下降13%。董事長還專門成立一個應收帳款小組,而BI一直躲在後面。

一連好幾個模型都給到了督查中心,督查中心的成績在公司郵件屢屢得到表揚。我找到督查中心老總,我笑眯眯的說,X總,你得誇誇我吧。

後來督查中心向信息中心CTO發了兩千字的感謝信,感謝信息中心的支持與幫助。CTO看到之後大為欣喜,把感謝轉發給了IT團隊的各個總監。

這件事算是打響了,接下來應該會有業務部門找我了。我心裡默默的想…

果不其然運營、營銷等等業務部門開始找上我,那些被督查瞄準的業務部門都想看BI的數據看板。

我的團隊開始慢慢的從2人陸續增加到6人,後來迎來了@路人甲

那個時候數據中心意識到我的存在,對於我這種積極主動找業務,培育業務數據管理的IT,加上我這人性格鮮明,反正很不待見。

當然我也很不待見他們,一群只會做Excel,連SQL都不會寫,每天的工作就是給各業務部門發日報、周報、月報。憑什麼叫數據中心。我給自己下了一個目標,必須成為這個公司唯一的數據Owner。

於是我主動找了CEO,我說你把我放到信息中心四個月了,我需要向您彙報下過去四個月我做了什麼。

精心準備了一系列對業務產生價值的PPT,並且必須量化,必須有數字,必須有理有據,就好像畫一個圓不能有漏洞,不然一旦被察覺,就會被人緊緊抓住不放,你在會上就會很難堪。

那段時間我寫PPT寫了四個月,每天早上醒來,枕頭滿滿的頭髮。每天都訓練自己如何演講,如何抑揚頓挫打動人。我是一個程序員也,一個從畢業之後就敲代碼的程序員,我甚至都不知道怎麼在PPT里寫備註。

彙報很成功,CEO動手幹掉了數據中心,要麼來我團隊,要麼調去其他部門。

我只要了一個人,剩下的Headcount 我自己招。

其實搞定了數據中心,搞定了業務部門,最棘手的,我搞不定下游的大數據研發組,他們做的報表一塌糊塗,數倉的那一套是十年前的那套sqlserver。數據研發組總監也是一副不求有功但求無過的態度,畢竟已經四十幾歲了,我可以理解。

但是他數倉做不好,直接影響到我這邊。幾次challenge之後,筋疲力盡。

就是一頭不想動的老牛,你拖也拖不動。拿他不是辦法。

業務中心對大數據研發組已是怨聲載道,一個報表需求可以從需求-評審-開發-測試-上線歷經兩個月到三個月時間才能交到業務手裡。而兩三個月的時間變化,業務早已發生改變,導致開發出的報表沒人用。

我把所有報表拉出來一一找了各業務方詢問,一百多張表,僅僅40%的使用率。剩下的連打開都沒打開過。

我拿著這份證據直接找上CTO,很直接說:如果X總做不好報表,我來做。

CTO不相信我能搞定,就回絕了。

沮喪的我問前領導@互聯網金融的魚,是不是因為我是女生,所以大家覺得我技術能力不行,太歧視人了吧。前領導懟了我:那你把頭髮剪了。

過一周後我一頭長髮全部落地…

就是你們現在看到的樣子,變成了假小子。

我性格就是這樣,決心做一件事就不會放棄。

我找上了產品部的報表需求分析師,我說你把接報表的需求給我吧,你應該做數據產品經理。說服了他三天,他同意了。後來他沒有成為數據產品經理,但是把跟業務部門對接數據的工作全部給到我了。

以後業務部門只能通過一個渠道提需求,那就是BI。

這種感覺就像什麼呢?就像我抓住了大數據研發組的咽喉,隨時都可以捏死。

不過我是做事的,就想數據驅動業務發展。所以本著和大數據研發組好好合作的態度,持續到現在。

我們團隊創造價值報幾個數字(2017年1月至今:

1、金融信用模型(類似於芝麻信用),為公司帶來三億低成本投資;

2、通過數據分析,為公司應收帳款

在一周內下降13%;

3、 為公司拉了42個每月百萬級交易的客戶;

4、幫公司減少了30+人/每天的數據處理工作;

5、N+小微客戶的加入;

等等

始終覺得部門幾個人支撐不了33個分公司和30+總部業務部門。我需要培養每個業務部門「種子選手」讓他們為我們分解壓力,於是我做了數據分析師訓練營,把對數據分析有興趣的業務人員聚集在一起做了兩天的封閉式數據分析培訓。三分之二全是實操。效果很不錯,最後有個比賽,同樣的數據源,每個人看法都不同,做出了很有意思的分析看板,講出了很棒的story。

有個應屆畢業生,學市場營銷的文科生學習了課程,已跳槽做數據分析師,工資直接double.

學會數據分析的工具僅僅只是基礎,他本身是個很有想法的小朋友。

我們的學員不管在公司效力還是跳槽,只要對他自己有提升,其實我就很開心了。

這還是不夠…

我把BI的數據分享放到了新員工入職培訓裡面,三個點:

1、公司業務數據大類

2、如何向BI提出數據需求

3、BI做出的數據案例

我需要讓每一個業務員工都知道BI團隊就是服務於他們,幫助他們,讓他們從進公司那一刻起就知道BI就是數據Owner。

故事到這已經結束。

做個題外分享:

1、其實BI做的有成績有價值的往往不是業務部門提出的,而是自己的idea自己主動去做,沒有領導的安排,然後說服業務,指導業務。

2、數據團隊和業務部門團隊合作,讓業務部門直接說出價值點。按價值排優先順序。

3、合作看「人」如果業務部門的老大沒有Sense,優先順序排最低。

4、數據團隊不是慈善機構,做的每件事都必須創造價值,量化價值,讓老闆知道價值。不然一幫兄弟怎麼升職加薪。

5、與業務建立信任很重要,直接開誠布公談說我為你們業務做這件事我數據團隊能獲得哪些利益。有些事沒必要拐彎抹角,直接說更來得真誠。

6、彙報PPT很重要,演講能力很重要。

彙報好壞等於數據團隊兄弟們的地位和加薪啊!

7、跟著我的Beauty 一年內兩次加薪,第一次20%、第二次45%。如果她不是去追求詩與遠方,應該是一年三次加薪,第三次是20%。已經遠遠高於她的同門了。為什麼她加薪那麼多,很簡單,她運用數據給公司拿了三個億等等價值。

8、數據分析工具的運用,並不是最重要的,有想法講得一個好故事並能證明驅動業務增長才是結果(管你是excel還是python、R)

9、@路人甲到公司到公司兩個月時間,用數據為公司拉了42個百萬級客戶,每月收入增長500萬。其他的小客戶暫且不談。(這期間小甲做了不少事情,比如行業報告、各自Dashboard

10、做正確的事比正確做事來得更重要。只要覺得方向沒問題,咬牙堅持一定會成功的。鬼知道我中間有多少次崩潰想放棄。

整篇文用手機碼,會有點亂,不過真的寫了手快斷了。


讓更多的開發者有單接,能賺錢,是我們一個很重要的目標。然而,我們經常遇到的問題是,一方面企業方的需求找不到人接單,一方面開發者們覺得單不夠。

而當我們再深入挖掘時,發現過去1年多,居然發生了1000多次拒絕接單,這又是為什麼呢?

帶著這個問題,我簡單地分析了一下我們的數據,發現一些有意思的事情。

工具是:JupyterNotebook + Python3 + Pyecharts + SQL

數據準備:

從資料庫中取了從2016年10月到2017年7月間的項目數據,包括項目時間,要求的功能,以及開發技能,超過10次對接的項目開發者不接單原因。

數據分析:

一、需求的功能層面,視頻曾經是主流,目前轉向機器學習應用,數據分析等。

1. 從2016年10月來看,當時用戶比較多是沒有填寫功能要求,這個情況隨著時間推移逐漸減少;而越來越多的情況是,客戶找不到需要的功能,於是只好填入了其他。

2. 2016年10月開始,企業方做得比較多的功能是圖文,視頻類,尤其是視頻類。這和16年全年的視頻熱不無關係。

3. 隨著時間推移,機器學習及相關應用類,數據分析類需求開始變多。可以預期,接下來,人工智慧類,比如說語音識別,圖像識別等將越來越火。

而這方面的人才,也將越來越搶手,尤其是產品經理和開發者。

二、技能需求越來越明確,APP需求變少,微信需求/數據分析需求變多。

從下圖可以看出,16年10月時,客戶還不太選擇要求技能,這其實導致我們在匹配開發者的時候,會有比較大的誤差。而隨著時間的推移,一方面是老客戶逐漸越來越專業;一方面是新客戶的專業度更高,越來越多的技能要求隨著需求同時發布,因此匹配的精準度也會高很多。

而其中,我們看到有明顯變化趨勢的是:對APP的開發需求在逐步下降,因此iOS/OC/Swift的技能要求明顯變少;同時,對於人工智慧,數據分析,微信端開發的需求在逐步上升,因此Python,jQuery, javascript的要求明顯增多。

三、開發者不接單的主要原因

接到訂單的那一刻開發者無疑是欣喜的,那麼什麼原因會導致不接單呢?

從目前拒絕接單記錄中,我們會發現,問題主要如下:

1 - 項目需求和自身能力不匹配,這是最關鍵的原因,佔比48.75%。

這類問題一般發生在新技術/難點技術方面,再深究原因,會發現,

1 -和第一點第二點相呼應,主要還是因為需求的方向在一年之內可能發生很大變化,而開發者的技能棧卻相對固定。熱門方向人手不夠導致系統後期在更廣泛的方向進行對接,導致對接難以成功。

2 - 技能匹配依然還做的不夠細緻。

2 - 其次是客戶給出的時間太短,導致開發者不敢接單,佔比39.58%。

3 - 第三是價格太低導致的拒絕,佔比13.52%。

而由於在審核時,客棧已經對需求進行過篩選過濾,所以由於需求不明確導致的不接單只佔了2.21%。

對應的詞云:

基於以上,可見我們在為開發者提供合適的開發工作這一塊,還是有非常多需要去提升的:

1)需要幫助企業方去更加明確所需功能,以及具體的語言/技能要求;

2)需要更加及時地對熱門的功能/技能需求做出反應,招募對應的開發者來簽約。

3)更細緻更小顆粒度地分析項目

4)更合理的時間建議

以上。

另外,最近在思考的兩個問題:

貓行天下:如何看待「求職大學生李文星之死」事件?

https://zhuanlan.zhihu.com/p/28034317


其實,選擇行業是一件複雜的事,也不是我們能夠控制的事。

如果有成功的模式,

最簡單的法則也許是:

找到你自己的心,找到可以讓你一輩子覺得沒有白白活過的事,

然後,用心去做。

然而,這個貌似簡單的成功法其實是一句正確的廢話。

什麼是好的行業啊?又要回到複雜的輪迴,比如:

觀察現狀

分析數據

預測趨勢

然而,就算天才,也很難預測未來。但是關於數據,可以聊聊不太一樣的:

首先,數據能幹嘛?

你可以試錯,風險是你老闆在扛,但請盡量降低風險,成熟的成年人都能明白百分百成功是神話。

所以要學著看數據,學著當個有責任感的人,這樣很好,但要小心數據陷阱。比如說:

其實,數據有噪音。

畫一張圖表,就像女人情緒化的波動起伏,你指著數據孤證或者偏差的絕對值來證明女人太情緒化,這就不對了。

事實上男人每個月也會來幾天,而且高低峰值的起伏也不會太小。

所以,你需要多方驗證男人和女人的情緒變化可能是刺激點不同、頻率不同。一但情緒來了,男人的情緒波動不會比女人來的小,只是宣洩的出口不一樣。

真的是這樣嗎?我們得做假設,進一步的深入分析。

第二個陷阱,人類只願意相信自己相信的事,在取樣的時候,會有意無意造成取樣偏差,錯配因果關係或倒因為果的自證假設為真,這經常發生。比如說:

移動端使用時間越來越長,你指著數據說男人在手機上玩遊戲的時間比女人還長,所以男人越來越沒家庭的責任心,這就不對了。

你要想到,女人在淘寶挑東西還有微信上東拉西扯的時間比男人玩遊戲的時間更長,這樣的邏輯推理才有意義。

到這裡,你知道男女都會情緒化,都會花很長時間玩遊戲和買東西,然後你還要花更長時間去對比之間的正向關係,到底什麼原因形成的「心理動機」。

比如是不是跟工作時長有關,和工作收入有關、和還貸有關、和到了適婚年齡依然是單身有關。一步步對比,才能找到真正的癥結點,對症下藥。

從這堆數字里,你會發現各種不同階層的人的生活樣貌,他們的生活習慣,以及對於某些事情的喜好。你越來越清晰的「看見」他們,了解他們的需求,知道如何投其所好。

開始有了數據推演的邏輯和吃瓜群眾的最大區別,就是你不再會「武斷」的把任何事情貼個標籤就完事。

學看數據,和看熱鬧的吃瓜群眾不同。

吃瓜群眾對一件事的看法,只會簡單來一句:「因為現代生活壓力山大,所以吧啦吧啦」。聽起來像先知,其實是懶惰。而且有時候,可能還會蒙對而一直沾沾自喜、傲嬌自滿。

但是經營一家公司或管理一個部門,可不能經常靠蒙的,或者隨便定一個kpi,夜路走多了摔到坑裡多的是,痛到爬不起來的那一種。

因為,看不到癥結點就不知道怎麼避開風險。kpi定錯了,把整個公司帶歪了都是常見的。再舉個例子,你的公司是以不斷獲取新客戶為主?還是服務舊客戶為主?比例各是多少?如何強化自己的優勢?這些都是靠不斷的假設和數據的論證來求解。

再來,你害怕風險嗎?

你的老闆比你更害怕。風險通常像是隱形的、無意識的,所以一般人也就容易胡思亂想,掉進坑裡了還會怪罪為什麼坑要挖在這裡?!

其實,坑就在那裡,不偏不倚!吃瓜群眾就是這麼任性又精準的跌進去。

數據不能百分百的帶你飛向成功之路,但是可以降低你掉進坑裡不會那麼痛,或者可以為你提高達成目標的精準度。

機會在哪裡,看數據。

比如說九月份,從數據中發現結婚前籌備的市場已經產生了巨大需求,還有好多的相關衍生行業,在八月份就要好好的準備打底。

說個例子,你可以在知乎里進行上千上萬的回答。比如說我回答不到50題,關注破萬,你覺得是我僥倖還是抖機靈?那麼,如何才能知道哪些問題和答案可以為你獲得「贊與關注」?看數據。

當然,寫東西也需要一點技巧。但是,在哪些平台發布呢?理解能力的頻率不對,寫的再好也沒人看的懂。如何找到不同平台的頻率呢?也是需要靠數據來提高機會。

再假設做一個決定,勝敗是各50%,只要把風險降低到40%(只是舉例),到後來也會有10%的勝率。尊重數據才能在戰場上存活。

所以,喜歡鑽在數據堆里的人,都是尋找價值的探險家,用的好就會變成人生贏家。

另外,數據是一種工具。

如何將它視覺化是一種溝通技巧。善用這個技巧,薪水是會暴漲的,講話也會很有分量的。

你可以看看這個數據的溝通要領(來自我的想法):

http://www.zhihu.com/pin/893241062372544512

還可以看看這個數據分析快速入門

https://www.zhihu.com/question/29265587/answer/125091104

看完之後就問你,數據酷不酷,該不該懂一些。至少瞎逼逼的時候可以把99%的人唬的一愣愣的,最重要的是,和老闆要點錢挺容易,簡直就是人生贏家。

如果目的是要獲得你的贊,說點數據帶來的戲劇化效果就可以達到,但是卻不能讓你明白,怎麼用不同思維去面對數據。這麼淺顯易懂的道理,希望你能明白我的意思。

數據任何行業各種時候都有用,這答案是獻給社會新鮮人。即使你是一家公司的老闆,也可能是一位「社會新鮮人」,因為你對待數據可能相當的粗暴和不求甚解。

追求數據背後的聲音是一種自我否定的過程,也是一種價值的探索。不明白就多想一下吧。

祝你人生旅途愉快。

再給初學者一些資源練練手:

流量分析類:

百度指數

http://index.baidu.com/baidu-index-mobile/

阿里指數

https://alizs.taobao.com/

微博指數

http://data.weibo.com/index/mobile/newhome

360趨勢指數

https://trends.so.com/index

今日頭條指數

https://index.toutiao.com/

百度流量研究

https://mtj.baidu.com/data/mobile/profile/

愛站網-網站流量檢測

http://www.aizhan.com/

新榜-微信/微博/頭條數據列表

http://www.newrank.cn/public/info/list.html

企鵝風訊-遊戲數據

http://fsight.qq.com/?from=coop_woshipm_yuqing2

ASO100-安卓應用數據

https://aso100.com/rank/marketRank?wn=1

ASO100-蘋果應用數據

https://aso100.com/rank/featured

排名列表類:

淘寶成交排名

https://top.taobao.com/

京東成交排名

http://top.jd.com/

百度搜索風雲榜

http://top.baidu.com/

數據工具類:

百度統計-各行業分析

https://tongji.baidu.com/web/welcome/login

騰訊移動統計

http://mta.qq.com/mta/

百度圖說-數據可視化

http://tushuo.baidu.com/

ANTV螞蟻圖說-數據可視化

https://antv.alipay.com/

數據可視化分析:

艾瑞諮詢-行業調查

http://www.iresearch.com.cn

AC尼爾森-趨勢研究

http://www.nielsen.com/cn/zh/insights.html?pageNum=1

騰訊地圖可視化

https://heat.qq.com/index.php

京東智圈-商圈調查

https://zq.jd.com/lifeindex/lifeIndex.html

新浪圖解天下-新聞數據可視化範例

http://roll.news.sina.com.cn/chart/index.shtml

網易數讀-新聞數據可視化範例

http://data.163.com/special/datablog/

移動觀象台-行業報告

http://mi.talkingdata.com/reports.html

(最後,這個導覽很齊)

Hao 199IT大數據-更多專業導覽集合

http://hao.199it.com/mobile/index.html?from=singlemessageisappinstalled=0

貼的手都累了,關注有乾貨,喜歡走起


我的高三班主任,大學是統計學出身,有一個小本本(見過好多次),我們班每個同學都獨佔一頁。

每次做操記,考試記,平時記,把每一次考試成績的分析能夠以行,列,並以周圍小集體為單位,綜合各種因素最終得出結論。

然後你就能見到每個月的班會,班主任都會做一份ppt,給我們講班級整體的學習風氣,以及重點幾位同學最近的表現,每次都以A,B,C同學表示,賊有意思(雖然不說名字,但是我們都能夠猜到是誰)

當時的我們就是全程這個表情

譬如說,之前講過一段,A同學在7月月考中,數學成績下降,選擇題部分成功率有所上升,不排除運氣好的成本,大題得分率抖降,

解題思路思路混亂,結合該同學近期的感情狀況來看,可以得出一下結論,

1.初談戀愛,內心澎湃,把對於女同學(她女朋友是學霸)的愛慕之情順帶到了數學學科,

小動作較多,符合選擇題解題思路多樣的考察目的。

2.戀愛初期需要磨合,時不時的吵架,這種內心的不快讓A同學發泄到了數學的大題上,整個人對於戀愛的觀念由初期的懵懂,到現在的混亂難懂,致使其在大題上亂寫一氣。

最後總結,感情學習兩手一起抓,固然是好事,然而在學習的過程中要做到心無旁騖,不為感情所羈絆,該同學還有很長的路要走。

ps:高3班主任比較開明,對於戀愛這種事處於放羊。


曾經用數據分析來填報自己的高考志願。

坐標江蘇某二線城市,10年參加高考。

當年本一線是355(理科),但我的高考成績並不理想,分數就高出本一線近20分,省內排名1萬多,具體多少忘了。

查成績的時候,我母親還慶幸自己高出本一線一截,但我看到這個分數時就深知自己填志願的時候會很尷尬,因為這個分數段的人數很擁擠。問了比我低一分的同學,全省排名差了近1000,更何況當時還想報考金融或統計(too naivee)。

當時呢,是想報考A大的統計學,這分數不看專業只能在A大和B大徘徊(A大比B大高5、6分)。但是進A大即使是最低錄取分還是有風險; B大是能進的,也只能挑到中等類專業。

之後多方打聽,了解到的A大在入學半年後可申請轉專業考試,這就表示不管怎樣我能進A大就有很大機會能轉去統計學,並且問了當時這個專業的學姐,難度並不高。於是我將目標鎖定為A大,先踏進這個門檻再說。

之前提到,進A大我的分數還是存在風險的,風險多大,我需要知道這個概率。

那整個分析的目標就定為:進A大的可能性有多少,A大的最低錄取分是多少?

風險考慮:

1、 最低錄取分具有不可控性,且08年高考改革,可參考的數據只有往年兩屆

2、 10年A大的在本省的錄取人數相比往年要少100多人

分析過程:

就08、09年數據來看,A大錄取分數和省控分數差10~17分左右,就最低錄取分來看,自己正好在這個範圍內,但也存在偶然性。

最靠譜的還是排名和高校在省內的錄取人數,於是我找來往年5分段排名的統計數據。

在紙上每5分羅列分數和人數,標記本一線和往年錄取分數段,大體是這樣

依據08年的A大最低錄取分,定位到分數段和人數總計。假設這個分數段的排名和分數是成比例關係的,計算出A大攔截的人數,和自己的排名做對比。同樣09年也按照這樣的方式推算。

關於風險因素2,有提到今年A大本省錄取人數要少100多號人,看了A大以上的其他學校錄取人數沒有這麼大變動。於是我假設08、09年也是這樣的情況的話,最低錄取分會高多少,最後推算出最低錄取分會將上漲2分。

大體思路就是以上這樣,還有一些風控把握的細節,已經記不起來了。我記得當晚算完第二天早上告訴父母,第一志願填A大,錄取可能性在85%,他們還是支持我的。

最後錄取結果出來的時候,如願進了A大也沒被調劑。後來公布錄取最低分數線,當年分數線居然居然破天荒只比本一高了幾分。後來了解到新增了倆專業,撇去這兩個看最低,比我預算的還要低兩分,也算在範圍內。

我還嘲笑自己,當年考數學能發揮這樣的功力,也不至於.....(哈哈)


這個問題可以說非常具體了,而我沒有機靈可抖(攤手~) 只能從別的方面來講講數據分析怎麼有用的了。

我這裡有一篇共享單車的數據分析文章,講數據分析如何解決車源調度典型場景,不知當講不當講 周五話分析 | 共享單車起航,數據分析跟上。

你不想點我複製過來給你看啊~

共享單車的創意 2015 年起就漸露苗頭,2016 年,爭奪用戶的戰爭正式打響。五道口、望京、酒仙橋,隨處可見橙色和黃色的炫酷自行車,隨後永安行、Unibike,小鳴單車等全部進駐市場,某不知名互聯網 er 張小紅曾經說過,留給創業者的顏色有限,晚一步只能出彩虹單車了。

出色的創意來源於靈光一現,商業模式成功絕非偶然。共享單車產品背後,一張大數據網路正在迅速鋪開。

共享單車車源調度典型場景

每一個人都有過遍尋街道,一車難求的辛酸經歷,地鐵站單車一排排,我的小區無人睬,這種用戶體驗簡直遜斃了。為此張小紅手機上安了六七個共享單車 App。這在我們互聯網行當里,需要引起高度重視,當競品出現在用戶手機里,你離用(gong)戶(si)流(po)失(chan)只有 36 小時(敲黑板)!

提高用戶體驗的背後有一座移動共享行業躲不開的大山——資源調度;改變困境不能依靠「人工掃街」,有一個說來容易做來難的方法——精細化運營。如何找到車輛缺失區域,通過數據驅動實現車源調度?神策數據分析師張小紅配了一個 DEMO 場景。

車輛缺失可能有兩個方面的原因:1. 車少了不夠騎。2. 車壞了不夠騎。影響兩方面的指標千變萬化,這裡簡單闡明幾種方法。

1.對比車輛的投放量和活躍量,判斷車輛投放少。

活躍量是反應車輛使用率的最直觀方式,根據監測的所屬片區的車輛投放量與有開始用車行為的車輛數進行對比,如果活躍量接近投放量,則該地區有車輛缺失風險,需要結合其他指標進一步觀察。

圖1 不同區域車輛投放量和活躍量對比圖

2.根據某區域車輛平均使用次數進行判斷,判斷車輛投放少。

精確追蹤每輛車的用戶行為數據,由於共享單車通常用於解決短距離交通問題,所以可以大體定位到區域內車輛。如果A區域內,一輛車的平均使用次數是 10 次,B 區域內平均使用次數為 20,那麼數據就會傳達給城市經理一個信息,該區域缺車,導致同一輛車被頻繁使用。城市經理通過歷史投放車輛數據的對比和實際考察,可以追蹤缺車情況,把控投放策略,提高用戶體驗。

3.根據10天內車輛不活躍數及假報修率綜合解決壞車問題。

圖2 10 天不活躍車輛數與假報修率概覽

密切關注活躍車輛數據,通過屬性分析可以觀察到,該區域有哪些車輛連續n天不活躍,說明該車有可能損壞了,再根據該車輛的地理位置屬性,可以定位到車輛停放位置,及時維修和補分配車輛。

同時需要警惕用戶的虛假報修行為。下圖是假報修率漏斗分析圖,我們可以看到,紅框是報修後發生結束被騎行為的車輛,毫無疑問,這些車輛被假報修了。點開下方數字,可以看到這些車輛的具體信息,方便師傅搬車。

圖3 假報修率漏斗分析圖

4.利用事件分析找到偏遠地區的車輛,合理調配資源。

圖4 偏遠地區車輛分布線圖

關注最後一單時間距離本次開始用車時間長達八小時以上的車輛,這些車輛沒有損壞,但是可能被停在了難以尋找到的偏遠地區,所以活躍率偏低,浪費了資源。公司需要對這些車輛進行人工調配,這也是一種解決其他區域缺車問題的「曲線救國」方法。

共享經濟下的大數據分析

移動共享意味著大量靈活性的資源流動,而共享單車、充電寶、smart 等產品的層出不窮,則恰恰驗證了這一模式的可行性。資源流動不可避免帶來碎片化資源的流動數據,用戶的多樣性也增加了產品的運營難度。

共享經濟是基於完善的大數據設施而實現的上層商業生態,互聯網為其提供了更大的平台和更豐富的模式,大數據則以科學的方式支撐著他們的運營和決策。數據驅動下的精細化運營與商業決策,幫助創業者解決資源調配問題,產品精準推送到人,在競品中脫穎而出。

看完了點個讚唄~~~~嗷嗚,拋磚引玉,歡迎發散性思維~

順便近期有個彩蛋,我們舉辦了一個2017數據驅動大會,邀請到了《精益數據分析》的作者、數據分析專家、哈佛商學院訪問執行官阿利斯泰爾·克羅爾中西對話,並邀請20+行業數據大咖同台分享~歡迎關注

2017數據驅動大會 | 智能·追本數源

阿利斯泰爾·克羅爾介紹


結論:數據能掙錢,這就是數據的價值體現,並且完全可以對很多人都有用。

代碼截圖:

看了那麼多大V的回答,都非常的專業和到位,我也勉強答一波,我就不談比較專業的問題了(我也不專業,哈哈哈哈),說我自己的一件事情,比較俗氣,關於買房子的。2016年中旬,那時候南京房價基本已經處於高位,幾大主城地區已經很難找到低於2萬的房子(除開偏遠郊區,比如高淳,溧水,六合),那時候我正好手頭有一點錢(差不多能夠到首付),放在口袋裡註定是貶值的,於是打起買房子保值的主意。

當時買新房幾乎買不到,要找各式各樣的關係,還要塞錢,我去。。。。這一點讓我感覺很氣憤,總之跑了很多新樓盤,都有這種現象,讓我覺得很噁心,於是我就放棄新房,直接看次新房,也就是5、6年左右的二手次新房,於是乎python大法用起來,用python寫爬蟲,爬取了南京幾個知名房產公司的房屋買賣以及租賃數據,再通過一些渠道拿到南京所有新樓盤的數據,當然還有交通規劃數據,還有各大板塊的配套設施規劃信息,通然後對比房價/租金/新房價格/地鐵建設規劃/學區安排/大型商超等配套設施,畫了很多圖表對比,最終定位到這個位置。

南京九龍湖版塊,當時5號線地鐵規劃還沒有下達,很多配套還沒有到位,因為我手上很多數據,我做了一些對比圖,這個區域2017年初有2個大型商場投入使用,附近6km範圍內有三家大型醫院,1所小學已經投入使用,還有一所小學在建。

北京東路小學

江寧開發區小學

而且新房價格達到3萬多一平甚至有一兩個盤出現接近4萬一平,二手房價只有2萬甚至有的房子可能2萬還差點,並且二手房價格上漲趨勢十分明顯,2室60-75平的房子租金能有3000往上,當時地圖上還沒有5號線規劃圖,就是圖上的虛線,我最終買到了虛線上的某一個站點旁邊,當時我也不曉得這裡會有這個站點,買了之後沒幾個月,站點就確定了,從我買的小區大門出來走100米左右就到地鐵站,並且現在已經有了南京有名的學區,太陽城和景峰兩個超大型商場投入使用。

2個商場離小區1.5公里左右而且兩個商場挨在一起。現在的圖就是上面這樣。現在看來,數據真的太有用了,數據可以告訴你怎麼做,可以讓你少走一些彎路,如果我沒有搞到這些數據,做一些對比分析,我根本不會買到里,我買的時候150萬拿到手,現在幾乎已經翻番了,2019年年初5號線投入使用,附近3km範圍內還有1號線、3號線、s1號線,至少我手頭投進去的錢保值了。真的要感謝我自己會爬蟲,懂得怎麼通過各種渠道拿到數據,懂得通過數據分析需求繪製我需要的圖,就這些看似簡單的數據分析技能讓我成功買到保值的房子,幾份數據就幫我賺到了幾十上百萬rmb,你還在猶豫什麼,這就是數據的價值體現啊!他能幫我掙錢,這就是價值體現!

後來借著用scrapy寫好的爬蟲又爬了一下上海鏈家的房屋租賃信息,準備去上海找工作。簡單的寫了一個租房建議,比較簡單,原先準備在結合職位數據,美食數據綜合分析的,但是懶得搞了,這裡也貼出來,寫得很簡單,覺得有用給個贊,沒有請輕噴哈!

用數據告訴你在上海你得這樣租(sheng)房(dian)子(qian)

我自己也一直在學習數據分析的路上,我覺得數據分析實在太有用了!

數據分析真的很重要,你還等什麼,數據分析學起來啊!代碼敲起來啊!比如可以看看這些問題和回答:

如何快速成為數據分析師?看一看他們的回答 @秦路 @卡牌大師 @路人甲 @鄒昕

孔慶勛:你是通過什麼渠道獲取一般人不知道的知識和信息的?看一看他們的回答 @孔慶勛 @何明科

也可以看看我之前寫過的文章:

SparkSQL數據分析項目---數據統計工作

SparkSQL數據分析項目---數據可視化

數據可視化--Matplotlib


作者:韓寒

2009年10月16日08:01

  

  前一天,我們從上海《新聞晚報》上得知,上海要更換5000塊路牌總共耗費兩億元人民幣。第二天《新聞晚報》又刊登文章進行了解釋:據記者掌握的數字,這5000塊指路牌只是一小部分,其實只佔所有更換量的五分之一。也就是總體要更換25000塊各種路牌。所以,就用2億除以5000來計算出40000一塊路牌,「太過於草率」。

  那好,就當是更換25000塊路牌,那麼這是個什麼概念呢?據悉,上海的高速公路總里程是600公里左右,這25000塊牌子中,假設有1000塊做了高速公路附近公路引路牌的更換,那麼還有24000塊是用在了高速公路上,於是,再做一下除法,我們發現,上海的高速公路每公里需要更換的路牌是40塊,也就是說,你在上海的高速公路上開車,每開25米,你就能看到一塊牌子,假設你的速度是120公里每小時,也就是說,你每秒鐘行進了33.333333333米,這代表著,你在上海的高速公路上開車,兩秒鐘內你差不多能看見三塊路牌或指示牌。

  太狠了,如果我開得足夠快,上海市公路管理處在路牌上畫點圖,我就能看動畫片了。

  假設我們公路不止600公里,用在高速上的各種牌子也沒有那麼多塊,兩邊都朝相關部門的有利方向放寬尺度,那我們一秒鐘也能看見一塊牌子,晚上這些牌子還都反著光,一分鐘你看六十塊牌,請問駕駛員們,你們開在高速公路上的時候,有過這麼夢幻到暈菜的時刻嗎?

  所以,這樣的解釋未免太過於草率了,好歹也要考慮人體工程學啊。

  我們再退一步,假設他的確大大小小是改動了25000塊牌子,花費兩億,那每塊牌子的平均價格也達到了8000元。8000元一塊牌子,這個工程我很願意承包。

  所以,這兩億里有沒有貓膩,其實很簡單,公路管理處把賬目公開了就行了嘛,包括你把這個工程承包給誰了,那事情就好說了嘛。你心中無鬼,我們又過於草率,那為何不給自己一個清白呢?

  其實這整件事最大的問題也正反映出我們愛折騰的特點。中國的道路交通中,聽到最多的抱怨就是路況差、亂 收費、道路管理混亂、設計不合理、施工質量差等等,很少聽到有人反映說路牌不規範。比如上海的高速公路,其實大家已經很熟悉,原先的A4,是莘奉金高速,就是從路牌莘庄到奉賢到金山的高速公路,一目了然,現在變成了G15瀋海高速,就是瀋陽到海口的高速,公路管理處的專家解釋說,這樣「方便駕駛員認準編號,一路到底」。

  你們覺得駕駛員同志都是有毛病的嗎?沒事上高速公路就一路到底,是為了方便那些本來開到松江的同志開到松花江嗎?這樣的理由是非常可笑的。而且,換一下全國高速公路路網的路牌,這個國家就花費了幾十億上百億,花錢是不是也太草率了?我們的教育、福利、扶貧為何又要常常哭窮呢?以前換下來的那些路牌怎麼處理呢?萬一又要換一次呢?換路牌是眼前的燃眉之急迫切需要解決嗎?(選自韓寒博客,有刪節)


說句實話,雖然在學校的時候學了很多數據科學方面的知識,不過總覺得自己是在紙上談兵,所以也容易產生題主這樣的困惑。

不過工作之後老闆更看重結果,更在乎分析結果有什麼用,所以這算是一個很好的檢驗方法了。

由於我入職以來做的大都是文本方面的分析,所以接下來舉的例子也是偏文本方面的。以下就是我覺得數據分析真的有用的時候。

1.客服聊天機器人優化

這個項目是我剛去公司實習的時候做的。項目背景是:公司旗下APP中的客服機器人命中率過低,導致很多用戶得不到滿意的回答而轉接人工服務,造成客服部人力資源緊張。於是客服部的boss希望我們能夠分析一下用戶在客服系統里的聊天記錄,看看用戶到底關注什麼以及哪些問題是機器人不能命中的,最後要達到的目的是優化機器人現有的詞庫,減少重複問題的人工回復。

於是我取了近三個月的聊天記錄,在清理完數據之後,直接用Rmysql包把數據從mysql傳到R里,用jiebaR分詞,定義刪除停用詞,統計高頻詞,用wordcloud2畫出詞雲圖,再判斷哪些高頻詞是客服系統不能命中的。

以上講的是操作方法,我們更要關注的是:

  • 高頻詞中哪些詞與業務聯繫緊密,可能是什麼業務場景產生的?
  • 從未命中的高頻詞中總結出用戶都在講什麼,每個詞歸納出幾個典型問題。
  • 根據前兩步,提出優化的規則建議,比如當命中某個詞的時候,建議添加機器人的回復是什麼,這是最重要的,可以說整個項目都是在為這一步做準備。

至於項目效果,後來我部門的老大表示客服的boss很滿意,後來客服也提出讓我做第二版的優化建議,我在第二版的郵件開頭這麼寫到:

Hi all,

我們在4月份做了第一版的xx機器人分詞分析,客服基於我們提出的建議做了優化,轉人工服務的比例下降了xx%,在上次分析的基礎上,我們做了第二版的分析,希望可以更進一步優化客服知識庫的內容、降低客服成本、提升客戶滿意度。

這個時候我就覺得數據分析不僅有用,還能為自己帶來價值感(zhuangbi)~

2.用戶分層之RFM模型

關於這個模型的介紹就不再多說了,知乎上也有介紹:RFM模型如何實際應用?

在leader的建議下我計算了三個合適的欄位分別來表示R,F,M。同樣清理完數據之後,在R里直接用kmeans()函數,最後將用戶分為四類。

項目的落地主要是由市場運營的同學完成,類似於:對高價值活躍用戶我們要採取保留措施,而對高價值低頻率用戶則要加大推廣營銷。

這個項目的意義在於利用數據來做精細化運營。

3.貼吧數據爬取之輿情監控

項目背景:由於本人在互聯網金融公司,前幾個月由於某些原因導致公司貸款業務出現了部分放款延遲問題。於是客服系統又爆了...不過這回不關我的事了。但是對於這件事的輿情我們需要掌握一下。

在leader的建議下我爬取了app的百度貼吧,數據包括帖子標題,回復人,回復時間,回復內容。另外由於公司開通了快速放款通道,部分用戶在回復里留下了自己的手機號碼,希望能夠給他們優先放款。

具體操作就是python寫爬蟲,然後用pymysql將數據傳入mysql,最後再用R做分詞以及用自定義詞典的方法做了情感分析。(ps:我現在正在強迫自己用python做更多的數據分析工作)

情感分析的效果還不錯,最後得出了日期以及每日負面情感的比例。可以看出從業務出現問題後(6.9),負面情感的比例變化是符合邏輯的:

還是一個道理,數據拿到了,更重要的是我們用這些數據做什麼。關於輿情監控我們做了以下幾點:

  • 用戶關注問題(根據回復內容分詞)
  • 負面情感佔比趨勢
  • 活躍用戶監控(Key Opinion Leader,根據帖子回復人統計)
  • 敏感問題監控(搜索關鍵詞:「投訴」等)

其中,關於活躍用戶監控的落地效果最好,這是因為根據爬取到的帖子回復,可以將留下的手機號提取出來,再拿到資料庫里去和用戶信息匹配就能找到這部分用戶的賬號信息。最後將這部用戶告知風險政策的同事,對這部分用戶在放款,降額等操作的時候要多注意。因為他們可能是在貼吧引導輿論走勢的人。

項目結束時,CRO也在郵件里表示:這個分析非常棒。 這個時候我又覺得數據分析真的有用,因為這個月的kpi有著落了。

總結一下吧,我只做了三件小事,很慚愧,算是對公司做了一點微小的貢獻。

以上

(最後的最後,第一次求贊求關注啊!!


今年,轉行做了新媒體。

每天接觸大量的數據,閱讀數、轉發數、點贊數、取關人數、新增人數、公眾號會話人數……

這個時候,數據分析就非常有用。

比如,當日文章的閱讀數決定了粉絲的留存數,決定了點贊數,而閱讀數量的高低直接與文章標題和轉發數量相關。可以說,所有數據之間都相互影響著。

經過每天的數據分析,我大概得出了,某段時期,某類文章是粉絲轉發極高的,這樣能夠保證粉絲的留存和新增粉絲的數量。而且同樣的文章,只要是粉絲屬性差不多,多發幾次也無所謂,閱讀量都有保障。

在我每天數據分析的支撐下,我們公眾號有半年差不多都是粉絲正增長,閱讀量保持10%以上,還創造了好幾個10W+。然而,自從公眾號開始接黑五類廣告後,所有的數據分析都不行了。所以,數據分析是還是要建立在一個比較穩定的場景才行啊。


1,

8月份投放排期已經安排好,對接給銷售主管的時候她說xxx的效果不好,讓我評估過再投放。

直接截ROI過去怒懟。(主要煩她總插手我們運營部的事)

遂改口說xxx的投放不好轉化,聊得太累。

我隨手截了合作以來所有數據扔過去,多一個字都不想說。

2,

不揣測老闆的想法。

定提成的時候運營部的提成點一直存在爭議。(主要覺得我們沒有幹活。)

銷售部一直在說業績都是靠回購撐起來的(鍋都是我們的,業績都是他們的)

然後提出了運營部業績提成算投放三天內的成交額,投放三天後的成交額提成點較低之類的想法。

再怒。

做了回購率,3天內回購率為零,7天內回購率不到5,二十天內回購率不到15。而我們屬於快消品。

看著數據爽翻天,準備開會甩數據,質問為何辛辛苦苦用錢砸回來的流量和客戶,這樣的回購率是如何維護的。直男如我學會倒打一靶實屬不易。

我還沒有得意完,老闆問我她給我推送的公眾號分析沒有,能不能投放。

我說沒,只有一份可以懟你的數據。

卒。


數據分析:你賺的可能還沒有你的員工多


推薦閱讀:

RFM模型如何實際應用?
最新版QQ2012 beta2,QQ群可以@人了,你覺得好用嗎?
如果想分析一個產品,那麼分析的邏輯框架大概是應該是什麼樣的?
原來是做(移動)互聯網產品經理的,剛進入金融互聯網領域,怎麼能快速學會必要的金融知識?
如何理解張小龍說的「好的產品是用完即走」?

TAG:互聯網 | 產品經理 | 數據分析 | 運營 | 互聯網數據分析 |