數據分析師之數據分析入門
數據分析師之數據分析入門
數據分析(Data Analysis)——這個詞真的是如雷灌耳,裝B一絕啊!甭管什麼玩意,上來先整一通再說。「數據分析」甚是被提上了神壇,找工作或者聊點行業內的動態不提點數據簡直是沒法混了。坦白講,我對「數據分析」的概念知之甚少,僅有的那點理解:統計數據,分析數據,大數據(Big Data)。
如何對產品進行數據分析呢?或者說對我這樣的一個數據分析小白來講,該從何入手數據分析呢?思維體式格局決定行動結果。
第一要點:什麼是數據分析?
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和歸納綜合總結的過程。在實際應用中,數據分析可幫助人們作出判斷,以便採取適當行動。
當然,在我看來數據本身並沒有任何價值,正是由於分析方法的存在使得原本毫無價值的數據大放異彩。
第二要點:為何數據分析?
有人說,老闆要看數據;也有人說,VC投資需要;也有人說,公司運營需要... 產生數據需求的緣故原由有很多,我想現實中大多數人做數據還是為了獲得產品的客觀現狀並有所為的(我能這樣想,大概是因為我是個樂觀的孩子吧?)。
事實上,數據分析的緣故原由大概如下幾點:
評估產品機會:
產品構思初期,必要的需求調研及市場調研顯得尤為關鍵。產品機會評估對後期產品設計及迭代都至關重要,甚至說決定了一個產品的未來和核心理念。
分析解決問題:
產品出現不良狀況,肯定是存在緣由的。不可能憑空想像臆造問題,必須尊重客觀現實。那麼只有經由過程必要的數據試驗才能追溯到問題源頭,進而制定合理的解決方案,徹底解決問題。
支持運營活動:
你這個產品功能上線後效果怎樣?A方案和B方案哪一個更好些呢?諸如此類的問題,都牽涉到一個「標準」的問題。評判一個問題的好壞,最靠得住的恐怕就是數據了。以前我就說過「人是不靠得住的,人們總是願意相信自己想看見的東西。」只有給出真實、靠得住、客觀的事實——數據,才能對具體的活動作出最真實的評判。
預測優化產品:
數據分析的結果不僅可以迴響反映出以往產品的狀態,即所謂的後見性數據;也能夠給出產品未來時間段內可能會遇到的問題,即所謂的先見性數據。一個真實的數據指標必須是可付諸行動的。後見性和先見性的數據都可以付諸行動,區別只是先見性數據能預測未來發生什麼,縮短迭代周期,不斷改進。
第三要點:如何數據分析?
▍數據建模
理解理睬了數據分析動機,究竟什麼樣的數據指標才能達到期望的效果呢?那麼首先必須解決數據指標的定義,小我私家認為搭建數據指標模型大致要考慮以下三大要素:
綜合考慮商業模式與業務場景
聚焦數據指標背後的最初動機
多維度考慮數據可行、簡約、易比對
當然,也不克不及憑空瞎造數據吧?!數據指標模型一樣平常有以下三個途徑設計:
對現有指標進行優化性改造,數據指標之間合理交叉或許會帶來意想不到的驚喜;
不同行業交叉借鑒其他行業制定的數據指標;
潛心修行、發掘更多有價值有意義的數據指標(這一點有點扯...)
數據分析目標的調整,必然伴隨數據指標的變動。尊重事實、腳踏實地,了解數據指標的調整的意義及可能給產品帶來的後續影響,我覺得這是一種可取的改變態度。如果說只是為了改變而改變,無視事實、較低期望,這樣的調整還有何意義呢?
▍數據來源
數據分析的對象是數據,數據從哪來?數據本身的準確性從根本上影響著分析結果的有效性,所以確保有效、靠譜的數據來源至關重要。本人認為數據來源無非以下三種:
自有數據分析系統:
公司自有的數據是最源質化的數據,也是最靠得住、最全面的。一樣平常而言,有條件的情況下都是以內部數據為準;當然,創業型的微型公司大多都直接資料庫導出數據,還是要依賴產品經理二次加工的。
定量/定性調研:
沒有全面的數據咋辦?或者說想要分析的數據無法統計?那麼,拿起德律風、走上街頭、發放問卷都不失為一種可行的辦法。定量數據排斥主管因素,定性數據吸納主管因素。事實上,定性數據存在諸多不確定性,但也存在一個其他數據指標不具備的優勢——那是與真實用戶交流所得,有血有肉。
專業調研機構:
知名調研機構,比如:艾瑞諮詢、百度統計、易觀智庫、199IT-互聯網數據中心。一樣平常而言,權勢巨子結構統計調研的數據還是具有極強的參考性的,但也不克不及完全免於主觀因素。
▍數據分析
單純的數據其實不能為給我們帶來太多結論性的東西,還是要藉助一定的方法和手段將數據變得更加生動和有意義。
集成開發數據分析系統:
將所需的數據指標以技術手段直接設計成產品功能,可以定期定量地直接生成導出BI報表。
手動數據加工:
面對元數據而不是現成的結論性數據,產品經理只能親自操刀藉助EXCEL各種函數。面對海量數據,心態很重要!
委託分析機構:
有錢、任性、夠叼,請人分析。如果事事都依靠別人,那麼產品經理就瞬間失去價值了...
▍分析方法
有效的數據分析方法可以或許深度挖掘數據的價值,精益數據分析中大致介紹以下三種分析方法。
市場細分(Segmentation):
市場細分就是一群擁有某種共同特徵的劃為一個樣本,市場細分不盡可以應用於互聯網產品,對任何行業、任何形式的產品都具有積極的參考意義。
同期群分析(Coghort Analysis):
比較相似群體隨時間的變化,同期群分析給我們提供了一個全新的視角。可以或許觀察處於生命周期不同階段用戶的行為模式,而非忽略用戶的行為的過程性。
多變數測試(Multivariate Testing):
同時對多個因素進行分析,用統計學的方法剝離出單個影響要與結果中的某一項指標提升的聯繫關係性。同時改動產品的多個方面,看哪一個與結果的相關性最大。
小結
數據分析的核心其實不在於數據本身,而在於設計有意義、有價值的數據指標,經由過程科學有效的手段去分析,進而發現問題優化迭代。數據分析因價值而存在,數據分析本就是一個價值增量的過程。無論分析給出的結果是積極還是負面,都是價值承載體,必須以客觀的態度面對。數據分析是檢驗產品設想的最具說服力的工具,但忽略數據分析背後人性的思考,那數據分析也就在根本上失去了意義。cda數據分析培訓
推薦閱讀:
※3分鐘帶你認識知乎刷贊
※如何快速了解一個行業(長文預警~)
※Kaggle: 5000 TMDb電影數據分析實戰
※一些關於TI7隊伍的數據分析——Liquid篇
※MySQL入門