如何能夠在公司中真正的用好數據分析?

數據分析越來越得到各大公司的重視,但很多公司的數據分析人員都面臨著一個問題:如何讓數據分析真正在公司內得到有效的推廣和使用,真正幫助到業務的發展?

歡迎各位大神分享自己的經驗。


數據分析真正要能夠開花結果,關鍵還是在一個字-「人」上。今天我們就來聊聊怎麼搞定數據分析中的「人」。

第一個「人」,搞定公司的管理層。

讓一個人改變其多年的習慣,是一件非常非常困難的事,尤其是一個依賴這種習慣曾經取得過成功的人。而管理層恰恰是由一群這樣的人組成的。

傳統企業的管理層治理公司,往往是依靠他們一直以來的經驗和直覺,現在你需要讓他們認可數據,依靠數據來進行公司的管理。這種自我否定和新習慣的養成是極具挑戰性的。

我們公司的董事長就是這樣的一個人。

在最初的時候,當我拿著做好的分析看板和結論找到他時,他拒絕接受我的結論,給出的理由也非常可笑:「你做分析的基礎數據不準確」。天啊,我分析的基礎數據是從公司的生產系統直接獲取的,怎麼可能不準確?退一萬步說,假如真的不準確,難道首先想到的不應該是修正數據,怎麼可能想到先否定數據分析呢?

我知道,他怕了!一個人長期以來的習慣和經驗突然間被數據顛覆掉,這是他在面對著未知時的下意識抗拒。那麼我該怎麼辦?當時我沒有爭辯,只是靜靜的退了出來,但是一整套的計劃卻慢慢的浮現出來:

一方面,我需要給他時間和空間去適應這一改變,很多事情不易操之過急。在接下來的時間裡,我不斷的給他灌輸數據的重要性和外部的成功案例;同時,我也鼓勵和引導他進行一些簡單的數據分析,減少他的抗拒和不適,幫助他建立信心。

另一方面,我開始啟動對公司中心總層面的培訓和啟蒙。在其中尋找接受能力強的,有意願的進行重點培養,並不斷讓他們將取得的成績彙報給董事長,在整個高管群中形成討論數據的風氣。

經過3個月的努力,現在在公司的高管領域,已經形成了討論必以數據為基礎的風氣和習慣,董事長也變的非常非常重視和關注公司的數據。

第二個人,搞定你的競爭對手。

在我決定要切入並接管公司的數據時,存在有兩個競爭對手。一個是公司成立的數據中心,由董事長的女助理管理;另一個是信心中心的大數據研發團隊,是一個四十來歲的總監管理。

先說說數據中心吧。數據中心名義上統管整個公司的業務數據,是公司數據的管理者。其每日的工作就是通過excel整理數據,定時發給個業務部門。下面給個業務部門再結合自身的數據,用excel進行報表加工。這樣做的效率奇慢,分析的維度和實時性也無法得到保證。

這個部門我的定位就是競爭對手,赤裸裸的競爭對手。定位清楚以後,打法就非常清晰了。我直接切入給個業務部門,通過BI快速、直觀、準確、靈活的體驗,說服業務部門將它們使用的報表在BI上進行開發。與傳統的excel開發相比,BI能夠給用戶更好的體驗,很快得到業務部門的認可。

這時故事的高潮才真正到來。也許是感覺到了BI的威脅,數據中心的老大找到了我,指責我未經允許去對接業務部門的數據需求,要求我以後只能對接他們。笑話!你做不好就不允許別人做嗎?還要求我只能對接他們,憑什麼?我直接聯繫了給個業務中心的老總,請他們支持我。因為我切切實實的給業務部門提供了幫助,他們都欣然同意。

鼓起勇氣向CEO預約了一個小時的彙報會議,拿著各個業務老總的支持,我最近的成績,數據部門每日的工作,我給CEO做了一次彙報,充分的數據證明了我的價值和數據中心的無用。CEO直接解散了數據中心,我的團隊承接了數據中心的職責和權力。

這時還有一個大數據研發。其主要功能是負責整個公司的數倉開發,數據歸集,數據清洗和報表開發。相對而言,我和它在報表層面有競爭,但BI還是需要數倉和清洗歸集後的數據才可以進行數據分析。

開始時,大數據研發團隊非常的抵觸。他們認為我們不是他們的需求方,拒絕為BI做一些工作。同時,這位數據總監抱著多一事不如少一事的混日子精神,非常非常不認可我主動擔當,與業務部門充分合作的思路。他拒絕與我合作。

在和平溝通無效的情況下,我只能絕地反擊:首先,你不接我的需求?但你總不能不接業務的吧,那好我可以假手業務中心提出我的需求;其次,我開始在公司內部挑戰大數據團隊的價值,「數據是為業務服務的,你做的東西業務都不用,你價值何在?」,「你從來都不主動對接業務,一副大爺的樣子等需求,還算是服務部門嗎?」,「一個業務需求從提出到實現要3個月,業務哪裡等的急?」。

有業務部門的認可和撐腰,有切實可查的數據和問題,有鮮明對比的成績和結果,他只能服從。

此時此刻,我才真正在公司內部立住了腳跟。

第三個人,搞定你的直屬老闆。

大家也發現了,我在工作中經常會和公司各個高管,內部給個同級部門一起溝通,甚至還經常會直接給董事長CEO彙報。這一切固然直接、高效,但也犯了一個職場大忌:越級彙報。而在這件事里,最受影響的就是我的直屬領導:CTO。

一旦讓我的領導感覺受到挑戰,我不但無法得到他的支持,甚至還會受到阻礙。因此,處理好與領導的關係就變的非常重要。我該怎麼做呢?

真正想要得到別人的支持,你必須先對對方有價值。我推動BI在公司發展時,我的領導加入公司3個月。他雖然在信息中心推動了不少工作,但並沒有什麼對業務很直接的感受。業務中心經常吐槽,信息中心那麼多人,不知道天天在幹什麼。這個不正是他面臨的挑戰和困難嗎?就從這裡入手。

作為一個和業務部門非常緊密的IT團隊,我從不藏功,每每有業務部門對我表示感謝時,我都將領導放在第一位。業務部門的感謝郵件一封封的發給我的領導,一方面讓他能夠了解到我的工作成績,另一方面也能夠緩和業務中心對信息中心的質疑和挑戰。可以說,當時我的團隊是少有的能給信息中心爭光的團隊。這樣的下屬哪個領導不喜歡呢?

得到了直屬領導的認可和支持,讓我在工作中再沒有後顧之憂,能夠向前沖的更加果決,更加勇猛。

第四個人,搞定我的團隊。

一個好漢三個幫,這句話是至理名言。一個人再能幹,沒有好的團隊給你支撐,你能取得的成績是非常有限的。在我決定推動BI的初期,我就非常注重這個問題。

首先,我先確定了團隊的目標、組成和發展計劃。一個精兵強將的團隊,首先需要一個清晰的目標。它能夠讓團隊中的每一個人都知道自己為了什麼事而努力。我為團隊定下的目標就是:「數據驅動業務發展」。基於這一目標,我制定了團隊的組織結構和招聘計劃。

這裡要特別與諸位童鞋說明一下,往往一個團隊在初期,每個成員的工作壓力和強度都是非常大的。這個時候更需要讓大家清晰而準確的知道未來計劃是什麼,可能遇到什麼樣的問題,有什麼樣的計劃和策略等等。人類最怕的不是困難,而是未來的不確定性,這一點諸位一定要關注。

話題拉回來,當組織和計劃確定以後,最缺的就是人才的引進和招聘。其實在最初的時候,我就在各種會議中物色人才,在確定hire account 後,我與他們進行了多次的溝通,非常誠心的邀請人才的加入。我開的工資並不是最高的,但理想和情懷又怎是金錢能夠衡量?

當然,除了詩和遠方,我們也需要麵包和牛奶。為自己的下屬爭取升職加薪,應該說說每個領導都應該做的。但應該歸應該,如何做卻是非常有講究的。

首先,團隊必須要能夠出成績。這個成績必須是一個亮點,比如大大提升了公司的效率,或者推動了公司業務的發展等。記住,天天做老黃牛是很苦,但絕對不是成績,不是亮點!只有突破性的成績才能夠說服老闆為你買單,而對這個問題的理解需要讓整個團隊予以接受。

其次,取得的亮點要完全無私的授予你的下屬,千萬不能私藏。有的領導非常喜歡居功,自己的功勞歸自己,下屬的功勞也歸自己。這是非常短視的一種方式。因為作為一個團隊的領導,這個團隊取得的所有成績本來就是你的,何必抱的那麼緊?對於一個居功的領導,下屬是不會努力工作的,反正做好都是你的,我幹嘛要賣力?但如果能夠把所有功勞歸於下屬,幫助他們成長和發展,每一個下屬會像打了雞血一樣,這樣的團隊會非常恐怖!

最後,一個好的領導就是一個好的導師。大家看仔細哦,是「導師」而不是「老師」。一個優秀的領導要能夠挖掘和啟蒙你下屬的能力和天賦,幫助他們快速成長。當你成為一個人成長的導師時,你不但收穫了一個優秀的下屬,更收穫了一個終身的朋友!

在這樣的思路下,跟著我的Beauty 一年內兩次加薪,第一次20%、第二次45%。這樣的幅度讓所有人乍舌。而為的團隊也由兩個人快速成長為一個六人的分析團隊,這所有的一切僅僅發生在半年內。

第五個人,搞定你的「外圍」。

前面的人群都是我的直接關係人,他們對我的影響較大,需要專門列出。但同時還有這樣的一群人:他們與我的關係並非那麼緊密,但他們群體龐大,卻又非常分散。對於這群人我該如何對待呢?

中國有句古語:「眾口鑠金,銷肌毀骨」。意識就是說,只要大家都說你壞話,你就玩完了!其實這句話說的就是輿論的力量。而輿論力量的來源正是那些與你關係並不緊密的「外圍」人群。他們可能並不知道你切實在做什麼,對於你的印象處理來自於偶爾一兩次的溝通,就主要來自於別人的口口相傳。千萬不要小看了輿論的力量,它們的走向非常關鍵!

在日常工作中,你需要對外圍人群保持謙遜。正如我前面提到的,這批人群對你的看法更多來自於偶爾一兩次的交流,所以這部分的印象取決於你平時的風格。謙遜是每個中國人都喜歡的品格,面帶微笑,說話客氣點人是大家都喜歡的。當每個人都對你有好感時,人群的共識就將形成,這種共識到來的是一種輿論,非常正面的輿論。這種輿論將降低你成功的門檻,也會成為你最大的保障。

當然,這裡我講的並不是帶上一個虛偽的面具,而是一個人需要謙遜的品格。這需要很長時間的沉澱和修養,我也還在路上。

當你能夠搞定以上五個「人」時,恭喜你,距離成功只有一步之遙了。讓我們一起看看我的團隊半年間取得的一些成績吧:

1、金融信用模型(類似於芝麻信用),為公司帶來三億低成本投資;

2、通過數據分析,為公司應收帳款

在一周內下降13%;

3、 為公司拉了42個每月百萬級交易的客戶;

4、幫公司減少了30+人/每天的數據處理工作;

5、N+小微客戶的加入。

End


企業內部很多數據分析的大拿,往往是深度理解業務過程,用普通的方法就能完成很精彩實用的分析過程。

要使用機器學習的工具簡單。

但是使用它,使企業的價值得到提升,最重要的還是在深入理解業務基礎上,搭建合適的特徵庫。


問題的潛台詞是我已經有數據了,你看怎樣做好分析?

實際上在大多數企業里,所謂的數據是一大堆放在電腦文件夾中的Word 和Excel文件,分布在不同系統中的封閉的資料庫文件。這種情況下如同沒有數據,你分析這些文件夾,不如重新發起填報一次。

源頭規範數據收集在傳統行業里是重中之重,佔全部分析時間的90%,傳統行業只需拿出你1%的分析技能就能秒殺同行,差別不在於分析,而在於你能否搞定那源頭的90%。


見過太多打著「數據分析」名頭的為分析而分析的數據分析報告和數據分析師。

在分析前,希望先想清楚以下幾個問題:

1.你為什麼數據分析?分析的對象是什麼?(這個問題答好,你已經比80%號稱數據分析的人做得好了)

2.你的數據源是什麼?數據是怎樣獲取的?是否準確?

3.你的數據能否嚴謹地支撐你的結論?

解決好這幾個問題,遠勝於 數據爬取、編程分析、數據可視化等「奇技」。


最近公司為了拿菲詩小鋪化妝品的總代理,需要我做一個數據報告,市場總監需要我呈現出的效果是該品牌在中國線上市場份額越來越少,並給出解決方案。

第一天花了大量時間收集該品牌和競品的線上銷售數據資料,並將收集的數據整合處理,最後將數據報告呈現的效果如下所述:

【一】呈現該品牌和競爭品牌的市場份額變化。

通過該動態圖表呈現,菲詩小鋪雖然在彩妝行業的銷量還是在逐漸上升,但是相比其它兩款競爭品牌的增長趨勢來看,菲詩小鋪的疲態盡顯

【二】呈現該品牌和競爭品牌中的高質量寶貝數量變化。

菲詩小鋪的高質量寶貝數在市場份額中不斷縮水,在2012-17年間是三個品牌中唯一快速下滑的品牌。可以看出菲詩小鋪的經銷商在線上完全沒有培養起新的爆款,並且對於之前的高質量鏈接沒有做市場維護,或者是因為自己的市場已經被其他競品剝奪分割。

【三】呈現該品牌和競爭品牌中的大賣家數量變化。

這裡其實可以看出,前者剛闡述的高質量寶貝數量變化其實是和線上大買家數量的變化息息相關的,菲詩小鋪的線上大賣家數量在市場的佔比變化呈現負增長率,賣家數量歷年來都在減少,由此可見大賣家在市場中對於菲詩小鋪這個牌子的信心在不斷下降,反映出品牌方對於經銷商的信心維護是缺失的!

到這裡,我們已經得到了當前菲詩小鋪在線上市場中所存在問題,接下來如何給出解決方案,是數據分析中最為重要的一步,接下來我給出一點我的想法。

方案突破點之一:增加高質量單品鏈接

Part 1: 質量突破

在菲詩小鋪中選取質量優等的產品,尋找線上店鋪中含有高質量悅詩風吟和得鮮單品鏈接的商家合作,用同類目產品,進行直接正面競品。

比如:A商家中悅詩風吟的真萃面膜是高質量寶貝鏈接,我們會提供菲詩小鋪同等競品面膜的上架資料給到A店讓其上架,以此增加菲詩小鋪這款面膜在A店的關聯曝光率

並在價格上做差異化,引導客戶更願意嘗試這款面膜。在質量保證的前提下,轉化率得以提升,慢慢將悅詩風吟面膜的流量和轉化率轉移到菲詩小鋪的鏈接上。

Part 2 : 數量突破

在精細化培養高質量單品鏈接的同時,產品鏈接數量的增加也非常重要。只要商家願意配合上架,多一個鏈接,就可能增加幾千幾萬次的點擊率。

方案突破點之二:扶持優質賣家,重建市場信心

Part 1 : 個性化分銷概念

我們將對菲詩小鋪的產品按類目細節劃分後進行產品分級:

主打款--利潤款--輔助款

在菲詩小鋪的線上賣家中,對每個賣家的高質量寶貝和擅長經銷的寶貝進行統計,對於不同的賣家合作對應的款式。

同時會對經銷商進行綜合評估分級並做定時售賣情況跟蹤,查看店鋪進銷數是否一致:

一級商家-- 目標客戶 -- 潛力客戶

一級商家:尋求合作主打款培養高質量單品鏈接,做到每周跟蹤一次。

目標客戶: 對於特定單品進行深入合作,為他們引流,每周跟蹤兩次。

潛力客戶: 前期通過利潤款產品培養起對菲詩小鋪的市場信心。需每日跟蹤一次,繼而當潛力客戶往目標客戶升級的過程中,客戶對於品牌的信賴度也隨之提升,商家更願意配合品牌需求做市場推廣。

Part 2 : 是分銷更是營銷

針對符合菲詩小鋪消費群體的網紅店鋪,可以進行網紅直播限定款等等的市場營銷,促進網紅與菲詩小鋪的深度合作,將其粉絲轉化為菲詩小鋪的忠實粉絲。

ps:歡迎私信交流


有關數據和數據分析的高談闊論比比皆是。不斷有人告誡各大公司要規劃恰當戰略來收集分析大數據,並警告不這麼做可能帶來的不良後果。像《華爾街日報》近日就提到公司享有客戶數據這樣一個大寶藏,卻大都不知道該如何利用。有公司嘗試從巨大的數據中獲取實際可用的信息,我們歸納了管理者在數據應用上的四個常規錯誤。

錯誤一:沒有理解融合的概念

阻礙大數據發揮價值的第一大挑戰就是兼容性和融合性。大數據的一個主要特點是其來源多樣。然而,如果數據形式不相同,或難以整合,則其來源的多樣性將使公司難以削減開支,也無法為客戶創造價值。例如,在我們和一個合作項目中,該公司擁有豐富的數據,記錄客戶的交易量和忠誠度,以及專門的在線瀏覽行為數據,但是鮮少交叉檢索這兩類數據來判斷某種瀏覽行為即為交易達成的前兆。面對這種挑戰,公司創建了「數據湖」來容納大量非結構性數據。但是,這些公司能夠加以利用的數據目前都顯得雜亂無章,只不過是一些以文本,也就是說,當這些數據只是普通的二進位數字時,要將它們井然有序地存儲起來非常困難。要將來源不同的它們整合起來更是難上加難。

錯誤二:沒有認識到非結構化數據的局限性

阻礙大數據發揮價值的第二大挑戰是其非結構化的特性。對文本數據的挖掘已經有了特別的進展,其語境和技術所帶來的認識與結構化數據類似,只是其它形式的數據如視頻仍不易於分析。舉個例子,雖然擁有最先進的人臉識別軟體,有關當局仍然無法從大量視頻中識別出波士頓馬拉松爆炸案中的兩名嫌疑人,因為該軟體尚在處理從不同角度拍攝的嫌疑人的照片。

雖然從非結構性數據獲取信息面臨挑戰,但是各公司在利用這些數據初步提升分析已有數據的速度和精確度上取得了顯著成績。比如,在石油和天然氣勘探中,人們就用大數據來優化正在進行的操作,以及針對地震鑽井的數據分析。儘管他們所使用的數據在速度、種類和體積上都有可能增加,最終這些數據還是用於同一個目的。總之,一開始就希望通過利用非結構性數據形成新的研究假設是站不住腳的,除非各公司通過「實踐」有了這種專業能力,能利用非結構性數據優化某個問題答案。

錯誤三:以為關聯分析意義重大

第三大挑戰——我們認為是阻礙大數據價值的最重要的影響因素——是觀測數據的大量重疊使其因果關係難以明確。大規模數據集往往包含眾多相似或完全一致的信息,直接導致錯誤的關聯分析,誤導管理者的決策。近日《經濟學人》指出「在大數據時代,相互關係往往是自己浮現出來的」,《斯隆管理評論》在博客中強調雖然很多公司都能接觸到大數據,但是這些數據並不「客觀」,因為問題在於要從中提煉出值得採取行動的信息。同樣,典型的用於分析數據的機器學習演算法所進行的關聯分析並不一定會提供原因分析,因而不會給出可執行的管理意見。也就是說,讓大數據有利可圖的技巧在於能夠從僅僅觀測到相互關係轉變為正確鑒別何種關聯為因果形式,可以作為戰略舉措的基礎。要做到這一點就必須超越大數據。

谷歌趨勢是大數據的經典範例,它利用谷歌搜索詞條整合記錄。然而,它也說明了僅僅用於關聯分析的數據是毫無意義的。起初,研究人員稱數據可以用於反映流感的傳播。然而後來,研究人員發現因為數據體現的是過去,使用這些數據只能在現狀與過去模式相關的情況下,稍微改善應對行為。

舉個更具體的例子,假設一個鞋業銷售商向曾瀏覽其網站的消費者投放廣告。原始數據分析認為消費者看到這些廣告會更願意購買鞋子。可是,這些消費者在看到廣告之前就已經對該銷售商表現出了興趣,因而比普通人更願意進行交易。這個廣告有效嗎?很難說。實際上,這裡的大數據並沒有考慮營銷傳播有效性的因果推論。要知道該廣告是否有效,銷售商需要進行隨機檢測或試驗,選取一部分消費者不接觸這個廣告。通過比較看了廣告和沒看廣告的消費者之間的購買率,公司才能確定是否看到廣告能讓消費者更願意消費。這個案例中,價值主要不是通過數據創造的,而是通過設計、執行以及闡釋重要的試驗來創造的。

這是個試驗,不是分析觀測到的大數據集來幫助公司了解一段聯繫到底是僅僅相關還是因為反應潛在的因果關係而變得可以賴以作出判斷。雖然對於管理者來說,哪怕僅利用記錄消費者行為一拍位元組的數據來提升效益都很困難,但是比較參與了營銷活動的客戶和沒有參與的客戶——根據試驗結果——能夠讓營銷人員推論這個活動是否有利可圖。

開展實地試驗,得出正確的結論,採取恰當的應對措施,都不是輕而易舉的事。但是成功的公司已經有能力來設計、開展重要的實地試驗,並對其結果評估,採取針對性措施。正是這種「試驗加學習」的環境,以及對其能否加以推廣的理解和認識之上採取行動的能力,才讓大數據有價值。

只是,由於越來越多的數據樣本收益遞減,這樣的試驗並不一定需要大數據。比如:谷歌透露說其往往用有效數據的0.1%中的隨機樣本來進行數據分析。確實,近日刊登的一篇文章顯示大數據的大實際上是不利的,因為「資料庫越大,就越容易支持你提出的假設。」換句話說,因為大數據提供重疊的信息,公司能從整個數據集,也能從其千分之一的數據集中獲取同樣的信息。

錯誤四:低估了勞動力技術需求

開展試驗不是公司從大數據推測有價值信息的唯一途徑。另一個可行的方法是公司可以培養演算法技能,來更好的處理數據。推薦系統便是此類演算法的一個範例。推薦系統通過針對關聯數據的演算法向客戶推薦最相關的產品。只是,它不是依靠背後規模龐大的數據,而是依賴識別關鍵信息碎片來預測客戶偏好的能力。的確,往往不是數據的規模,而是計算機學習的演算法來確定結果的質量。儘管預測能力可能增加可用數據的規模,但是在大多數情況中,預測的提升說明規模收益隨著數據集增加而遞減不過,要建立好的演算法就需要好的數據分析師。一些公司以為不同聘請員工來分析數據中的因果聯繫就能將大量的數據轉化為信息,他們可能要失望了。

數據本身是沒有價值的。只有與管理、構建和分析技能結合來,明確對其進行試驗和演算法,才能對公司有用。當你把價格信息看做是對價格信息處理的技能時就清楚了。很多情況下,相對於數據成本,留住數據處理人才成本更高。這說明對於一個公司而言,數據處理能力比數據本身更重要。


上面兩位答得挺好。個人覺得,還得看什麼類型公司,本人從技術流角度展開:

曾擔任中山醫和中科院數據分析師,主要工作是幫實驗室和研究所人搭建數學模型平台。對於不同項目,數據分析角度不同。比如RNA和DNA序列分析,即使都被稱作為二代測序,但是分析方法有本質區別。因此,需要熟練掌握演算法編程,醫學背景和兩者交叉。

個人覺得要真正用好數據分析,編程基本功要紮實,同時對於所得結果的推論,也需要上升一個台階。


熱雲數據經過多年的發展,積累了海量的數據,其完整性和豐富性不僅能夠幫助移動互聯網企業真實反饋用戶的真實數據,並且能夠支撐到整個行業的生態鏈,還能基於用戶行為找到相似用戶群體未來的去向,更多的對具體行業發展趨勢做預測。熱雲數據領先的技術以及優質的數據分析服務,得到了越來越多客戶的信賴與支持。


兩方面,內部與外部

內部數據詳細,從中發現問題

比如推廣中逐層轉化的分析與優化

外部數據難於獲取,一般要搭配一些抓取方法

比如你可以從淘寶中抓取競爭對手的評價,分析找到用戶對競家癢點,痛點。


數據分析 在哪裡可以學?


先目標再分析


推薦閱讀:

HDMI傳輸無損信號,音畫質會有區別么?
做為面試官 當你問 C++虛析構函數 的作用時你期望的答案是什麼?
如何評價CUDA、OpenCL、OpenMP、OpenACC等主流並行運算框架?
如何看待通信和計算機的發展前景對比?
我想配一台5000左右的台式機。主要玩玩NBA 2K17系列,LOL 的電腦希望大神來個可靠配置?

TAG:互聯網 | 程序員 | 計算機 | 數據分析 | 大數據分析 |