標籤:

數據是你的生命線,請待她如待初戀

原文:Your Data Is Your Lifeblood,

(譯者註:很多人坐在數據的金礦上而視若無睹,特此翻譯了這篇文章,希望引起大家的重視。)

Ben Porterfield在自己的Linkedin主頁這樣形容自己:一個有經驗的衝浪者。除了在Santa Cruz海岸衝浪以外,他還幫助一系列初創企業在變幻無窮的互聯網浪潮中破浪前進。他是Sticky, Inc.(譯者註:一個成功的矽谷廣告數據公司)的首席工程師,接著與小夥伴聯合創立了Rally Up (譯者註:移動APP公司,2010年被AOL收購)。

他的經歷,容易讓人產生「連續創業原來這麼簡單輕鬆啊」的坑爹錯覺。

Porterfield的最新創業項目是Looker, 一個商業數據分析解決方案提供商。Porterfield帶領著一幫工程師幫助小至初創企業大到行業巨頭(比如Etsy, Sony, Disney, and Yahoo)更好地做決策。Looker幫助無數公司開發適合自己的演算法,從而也更清晰地看到為什麼會走這些彎路。

數據分析是一種經常被人視為假高大上的雞肋工具。當你正在焦頭爛額地為自己的初創公司設定市場定位的時候,你一定會把處理數據當做一種閑得蛋疼行為。但等公司走上軌道後,你需要更好地理解你的用戶,而此時回頭看之前積累得如同亂麻的原始數據,你會突然意識到你並沒有很好地收集你想要的信息。

在本文中,Porterfield將跟我們講解創業者們如何可以從一開始就設計好數據分析的基本框架:將數據儲存於何處?用什麼工具分析最好?可以規避哪些常見的錯誤?以及,今天的你如何亡羊補牢?

聽哥說,千萬別等了

你的第一想法可能是由你團隊里的工程師們胡亂拼湊點什麼來儲存這些數據。Porterfield見過太多抱著這個想法而失敗的公司。其實應該從一開始就投資更多的時間和金錢來尋找靠譜的數據收集分析工具。道理很簡單:

每個人都需要方便地使用靠譜的數據。

把數據分析當做吃喝拉撒一樣的日常基本需求,意味著讓你公司的每一位成員,而不僅僅是技術人員,都可以便捷使用。每一個人,特別是直面客戶的前線人員,都需要方便地獲取及理解這些數據。而一個好的工具能幫助工程師以外的其他人都輕鬆地從這些原始數據中獲得有用的信息,從而做出正確的決策。

而在建立這樣的數據分析基礎框架時,一定要考慮到如何讓沒有數理分析背景的小白使用者可以自主地設計數據跑出來的形式內容,因為這樣的小白使用者往往更更理解產品業務流程,更能提出核心的問題。

Porterfield還說到,若能把數據嵌入到各種唾手可得的日常應用中,企業能創造一種數據為導向的文化。從商業運營的角度來說,這樣一個能自助生成數據的平台能釋放原本專註於數據分析的工程師們,讓他們更好地專註於產品設計或者是其他更高層次的問題。

企業的數據分析團隊其實自身已成為許多公司發展的瓶頸。他們不應該像圖書管理員似的,僅僅是按照別人的需求去讀取和解讀數據。Todd Lehr, Dollar Shave Club的資深工程師分享了個類似的故事:有個叫Juan的開發者在公司負責生成所有數據報告。當他手頭積壓太多工作而卡殼時,我們也會因沒有數據而無法順利工作。我們把這種情況戲謔為「Juan式卡殼」。

而如果有一個良好的自助數據平台,企業則不需要聘請這樣的專人負責管理數據,從而也避免了這樣的「Juan式卡殼」。工程師們可以更好地專註於開發和優化產品。

The 6 Mistakes Smart People Make with Their Analytics

關於數據分析,聰明人常犯的6個錯誤:

幫助大量的公司梳理數據分析流程後,Porterfield總結出6個企業常走的彎路。

1. 走得太快,沒空回頭看路。

初創公司里的人們彷彿一直在被人念著緊箍咒:「要麼快要麼死,要麼快要麼死。」他們是如此著急於產品開發,以至於他們常常沒有空想用戶對產品的具體使用細節,產品在哪些場景怎麼被使用,產品的哪些部分被使用,以及用戶回頭二次使用產品的原因主要有哪些。而這些問題如果沒有數據難以回答。

2.你沒有記錄足夠的數據。

光給你的團隊看呈現總結出來的數據是沒有用的。如果沒有精確到日乃至小時的變化明細,你無法分析出來數據變化背後看不見的手。如果只是粗放的,斷續的統計,沒有人可以解讀出各種細微因素對於銷售或者用戶使用習慣的影響。

與此同時,數據儲存越來越便宜。同時做大量的分析也不是什麼高風險的事情,只要買足夠的空間就不會有system breakdown的風險。因此,記錄儘可能多的數據總不會是一件壞事。

不要害怕量大。對於初創企業來說,大數據其實還是比較少見的事情。如果正處於初創期的你果真(幸運地)有這樣的困擾,Porterfield推薦使用一個叫Hadoop的平台。

3. 其實你的團隊成員常常感覺自己在盲人摸象。

許多公司以為他們把數據扔給Mixpanel, Kissmetrics,或者Google Analytics就夠了,但他們常常忽略了團隊的哪些成員能真正解讀這些數據的內在含義。你需要經常提醒團隊裡面每一位成員多去理解這些數據,並更多地基於數據來做決策。要不然,你的產品團隊只會盲目地開發產品,並祈禱能踩中熱點,不管最終成功還是失敗了都是一頭霧水。

舉個栗子。有天你決定採用市場上常見的病毒營銷手段吸引新用戶。如你所願,用戶量啪啪啪地上來了。可此時你會遇到新的迷茫:你無法衡量這個營銷手段對老用戶的影響。人們可能被吸引眼球,註冊為新用戶,然後厭倦而不再使用。你可能為吸引了一幫沒有價值的用戶付出了過高的代價。而你的產品團隊可能還在沾沾自喜,認為這個損害產品的營銷手段是成功的。

這種傻錯誤經常發生。而如果你的企業在一開始就建立起人人可自助使用的數據平台,來解答他們工作中最重要的疑惑,則可以避免上文所說的悲劇。

4. 把數據存放在不合適的地方。

先讓我們來看一個正確示範吧。Porerfield提到他有個客戶整合了NoSQL, Redshift, Kitnesis以及Looker的資源自創了一個數據分析框架。這個框架不僅能在很高的量級上捕獲及儲存自己的數據,還能承受每月數以百萬計的點擊流量,還能讓所有人查詢自己想要的數據。這個系統甚至可以讓不懂SQL語言的小白用戶們真正理解數據的意義。而在數據分析的世界裡,基本上如果你不會SQL, 你就完蛋了。如果總是要等待工程師去把數據跑出來,那就是把自己陷入困境。而工程師在不理解需求的情況下建立的演算法或者買的軟體對於使用者來說往往是個煎熬,因為他們對數據的使用往往與前者不再同一水平線上。

你需要讓你所有的數據都存放在同一個地方。這個是關鍵關鍵最關鍵的原則。

讓我們回到前文那個假設存在的公司。他們做了一個又一個病毒營銷,但是沒有把用戶活動數據放在同一框架內,所以他們無法分析一個活動是如何關聯到另一個活動的。他們也無法進行一個橫跨日常運營以及活動期間的數據分析比較。

很多公司把數據發給外包商儲存,然後就當甩手掌柜了。可是常常這些數據到了外包商手裡就會變成其他形式,而轉化回來則需要不少工序。這些數據往往是某些宣傳造勢活動時期你的網站或者產品的相關數據。結合日常運營數據來看,你可以挖掘哪些活動促成了用戶轉化。而這樣結合日常運營數據來分析用戶使用歷程的方式是至關重要的。但令人震驚的是,儘管任何時期的所有運營數據都至關重要,許多公司仍不屑於捕獲及記錄他們。約一半以上Porterfield所見過的公司都將日常運營數據與活動數據分開來看。這樣嚴重妨礙了公司正確地理解與決策。

5. 目光短淺。

任何一個好的數據分析框架在設計之初都必須滿足長期使用的需要。誠然,你總是可以調整你的框架。但數據積累越多,做調整的代價越大。而且常常做出調整後,你需要同時記錄新舊兩套系統來確保數據不會丟失。

因此,我們最好能在第一天就把框架設計好。其中一個簡單粗暴有效地方法就是所有能獲取的數據放在同一個可延展的平台。不需要浪費時間選擇一個最優解決方法,只要確認這個平台可以裝得下所有將來可能用到的數據,且跨平台也能跑起來就行了。一般來說這樣的原始平台能至少支撐一到兩年。

6. 過度總結

雖然說這個問題對於擁有大數據分析團隊的公司來說更常見,初創公司最好也能注意避免掉。試想一下,有多少公司只是記錄平均每分鐘多少銷售額,而不是具體每一分鐘銷售了多少金額?在過去由於運算能力有限,我們只能把海量數據總結成幾個點來看。但在當下,這些運算量根本不是問題,所有人都可以把運營數據精確到分鐘來記錄。而這些精確的記錄可以告訴你海量的信息,比如為什麼轉化率在上升或者下降。

人們常常自我陶醉於做出了幾張漂亮的圖標或者PPT。這些總結性的表達看上去很令人振奮,但我們不應該基於這些膚淺的總結來做決策,因為這些漂亮的總結性陳述並不能真正反映問題的實質。相反,我們更應該關注極端值(Outliers)

The 3 Easiest Ways to Avoid These Mistakes

三個簡單防護措施幫你少走彎路

少犯錯誤遠比你想的重要,因為錯誤一旦發生,很容易耗費大量的工程時間和資源來彌補錯誤。如果不小心,你的工程師們可能花費昂貴的時間來為銷售團隊解碼數據,可能錯過無數寶貴的營銷機會。每當數據變得難使用或者理解時,你的團隊決策速度會變慢,因此你的生意進展必將受到拖累。

好消息是,如果你從有用戶伊始就採用以下三個簡單的防護措施,你一定可以避免走很多彎路。

1. 任命一個商業數據首席工程師

如果你能在團隊中找到一個隊數據分析真正有興趣的工程師,你可以讓他負責記錄管理所有數據。這將為整個團隊節省海量的時間。Porterfield 分享到,在Looker, 這樣的一個商業數據首席工程師負責寫能記錄所有數據的腳本,從而方便大家總是能在同一個資料庫內獲取需要的信息。事實證明,這是個簡單有效的方法,極大地提高了團隊的工作效率。

2. 把數據放在開放的平台上

Porterfield強力推薦大家使用類似於Snowplow的開源平台,以能實時記錄所有與產品相關的活動事件數據。它使用方便,有好的技術支援,可以放量使用。而最棒的一點,它能與你其餘的數據框架很好的兼容。

3. 儘快將你的數據遷移到AWS Redshift或者其它大規模並行處理資料庫(MPP)上

對於還處於早期的公司來說,類似於Redshift這種基於雲端的MPP經常就是最好的選擇。因為他們價格便宜,便於部署和管理,並且擴展性強。在理想狀況下,你會希望從公司有記錄之初就將你的事件與操作的數據寫入亞馬遜Redshift之中。「使用Redshift的好處在於這個平台便宜,迅速,可訪問性高,」Porterfield說。並且,對於那些已經使用AWS服務的人來說,它(使用redshift)可以無縫接入你已有的架構中。你可以很容易的建設一個數據通道把數據直接傳入這個系統中進行分析處理。「Redshift能讓你靈活的寫入巨量的顆粒狀的數據而並不根據事件觸發量的多少這樣難以估計的參數來收費,」他說。「其它的服務會根據你儲存事件的多少來收費,所以當越來越多的人使用你的產品時,越來越多的操作數據會被記錄下來,這會導致最終的收費像火箭一樣越升越高。」

如何用數據分析佔領市場先機?

數據分析的價值取決於它能如何幫助你佔領市場先機。作為初創公司,所有的數據應該被用於你對公司不同階段設立的目標上。

舉個栗子。一個快遞公司通常會檢測平均送達每件貨物的時間。這看上去是很關鍵的數據,但如果沒有充分的上下文(畢竟收貨人可能在一個街區外,也可能在幾百公里外),這也是沒有意義的。另一個角度上,平均送貨時間也沒有收貨人的整體滿意度重要。因此,你必須確保你的分析囊括了正確的數據。

請列舉量化你需要的結果:你希望你的客戶體驗是怎麼樣的?一些常見的成功數據分析會基於銷售或用戶轉化率(即如果客戶做了叉叉事情以後會購買或者成為用戶),轉化需要的時間,以及讓客戶產生負面體驗的比例。你會希望第一個比例很高,而後兩者降低。

通常來說,媒體網站會全然以網頁瀏覽量論英雄。但現在他們也開始注意一個叫做「注意力停留時長」的指標:人們在某個頁面專註多長時間,是否注意到某些字句,是否在上下拖動頁面,是否有看視頻,等等。他們不僅僅實在看用戶在某個頁面停留了多少時間,他們更需要知道用戶被頁面中的哪些部分吸引,且積極專註地瀏覽了多少時間。這樣可以幫助媒體網站設計新的標題,頁面設計和內容選擇,以延長這樣的注意力停留時長。這樣,他們可以革新網站設計的方式,來更好地打動他們的受眾。

另一個重點是監測留存用戶。成功的數據分析可以同時涵蓋日常運營數據以及活動數據,並橫向分析。如果你僅僅看日常運營數據,你能指導那些人會回訪你的網站,哪些人可以達成復購。但你還需了解哪些回訪網站卻沒有復購的人群: 為什麼他們不願意再次購買?這樣的問題可以通過介乎運營與活動數據分析來找到答案。活動數據會告訴你哪些沒有購買行為的客戶按照何種順序瀏覽網站,注意到了什麼,點擊了什麼,在離開網站前做了什麼。當你跟蹤這個線路,你可以了解如何修改這種行為,來增加他們下次訪問時購買的可能性。

為了設計最適合你的數據籃子,你可以參考以下三個建議:

  1. 尋找一類合適的用戶行為

  2. 測算多少比例的受眾會有這一類的用戶行為

  3. 測試這一類用戶行為是不是包含了重要的信息

有時候,發明一個新的數據記錄籃子可以促成對公司很大的改變。

拿Venmo(翻譯君註:一個紐約的小額支付平台)舉個栗子吧。有段時間,公司的支付APP團隊聽說很多本想向朋友索取款項的用戶不慎把錢反而支付給了朋友,因為「索取款項」和「支付款項」的按鈕放在一塊很容易按錯。然而公司並不知道這個問題有多普遍,是否值得公司重新設計用戶界面。為了更好地做決策,他們設計了一個新的數據系統來檢測這個索取/支付失誤有多常見。他們把「A向B付款後不久B雙倍將款項付給了A」這種奇怪的支付行為全都找了出來。結果顯示,這個情況經常發生。所以在下次的產品更新中,他們修復了這個問題。

讓你的數據可分享。

阻礙團隊輕鬆分享數據的罪魁禍首常常是數據的定義。因此,從一開始你最好充分完整地定義你的數據。可以考慮建立一個中央辭彙表wiki page, 來讓每個成員更容易理解。Porterfield指出,人們喜歡用奇怪的詞語給數據明明。比如「Ratio」這個詞就常備濫用,因為他們命名時常沒有把分子分母講清楚。

數據是大部分成功公司的生命線。好的數據分享不僅能增加公司的透明度,還能加強不同部門之間的協作。比如在很多公司里,不同部門常常會各自找工程師生成不同數據來回答同一問題。而如果有一個好的分享數據平台這樣的浪費時間精力可以被避免。

另外,讓數據形象化也是一個好平台能輕易做到的。把顆粒數據形象化為圖表可以讓團隊的每一個成員更好地解讀這些數據。對於大部分人來說,理解圖表比理解表格容易得多,因此把數據形象化可以幫助交流更加順暢。

不好的數據分析框架只會打擊人們的自信心。它會無形地把公司分為兩個派別:懂數據的大神以及不懂數據的白痴。這是個很常見的危險錯誤。你必須讓公司最小白的數據用戶都能輕鬆地生成自己需要的圖表並理解它。這是選擇數據平台的一個基本原則。

Poterfield總結道:好的數據分析能讓人們更有準備地去開會,幫銷售團隊問出更到位的問題,免去了無謂的猜測。人們不用再猜測他們的用戶在尋找什麼,或者為什麼他們達成銷售,或者為什麼他們不再回頭。人們也不用再猜測其他團隊的同事知道或者不知道什麼。而這一切都要歸功於從一開始就把數據框架設計好。

譯者:Shuyue Xiao

推薦閱讀:

看完後,你可能就知道要買什麼車了|2017上海車展
「駕駛體驗」相關話題最熱門 8月知乎汽車數據排行榜
可視化圖表初階
看科技創新如何改變數字營銷業務--帶你了解什麼叫「數字營銷」
菜鳥v.蜂巢 v.消費者

TAG:数据 |