互聯網數據分析方法 知識體系

互聯網數據分析方法 知識體系

來自專欄數據化運營 方法論

數據分析乍看起來是一個很常識的概念,但我們真了解它嗎?

一、什麼是數據分析:數據分析四要素

數據分析的目標:直接目標(描述、理解),根本目標(預測、決策)

數據分析的基礎:數據,這裡主要指未經處理的原始數據或各種資料

數據分析的方法:如何利用數據達到目標,主要是找到合適的工具和思維模型

數據分析的要素:數據、工具、模型、目標

數據分析的定義:即根據分析目標,找到相應數據,運用合適的工具與模型達到分析目標的過程。

二、數據分析方法的本質

1、數據分析的本質

數據分析的過程本質上就是提升認知的過程,即從一堆紛雜的數據整理提煉出有價值和意義的信息,進而組織加工成結構化的知識,並部分模式化為相對固定的指導人們日常實踐的理論。如,用戶點擊5次是數據,用戶本月使用APP共5次是信息,用戶活躍度不高是知識,每月使用低於5次的用戶很可能會流失是理論。那麼,如何實現這一升華?整體而言,數據分析的實現步驟也不外乎人們研究事物的兩種路徑:歸納法和演繹法。

歸納法即從目標出發,甚至是模糊的目標,然後尋找數據的規律,進而得出結論;而演繹法則是根據分析目標首先建立假設,然後用數據驗證,最終得到結論。二者相輔相成,使認知形成螺旋上升態勢。

數據升華的過程:數據—信息—知識—理論

數據分析的路徑:歸納法(目標—整理數據—尋找規律—結論),實現數據的意義化、結構化、模式化;演繹法(目標—產生假設—數據驗證—結論),實現智慧的概念化、指標化、測量化。

2、數據分析方法——工具與模型的本質

工具&模型的本質就是,幫助人們提升認知的各種能力,是實現數據升華的各種操作方式,即幫助數據實現意義化、結構化和理論化,或者根據既有理論利用數據完成概念化、指標化和測量化。歸納路徑主要依靠工具來實現,而演繹路徑則更多依賴各種模型,二者在數據分析中缺一不可,相輔相成。需要注意的是,這裡所謂的模型並不局限於演算法模型或者4P等理論模型,而是泛指各種思維方式或模式。

舉個例子,如果將分析目標比喻成做一把木凳子,那麼數據就是木材,工具就是鋸、鎚子等,而模型就是我們心中凳子的樣式以及實現這個樣式的組合方法。工具是我們改造外部世界的中介,沒有這個中介,我們即使有再好的想法也無法實現,它是數據分析這個動作的外在實現方式;而模型則是指導我們認識和改造世界的方式,缺少模型我們眼前的世界只能是一堆雜亂無章的物質顆粒,木頭組合成木凳就只能靠隨機的運氣,因此它是指導數據分析如何開展的必不可少的內在思維方式。當然,工具和模型也只是相對的,比如在具體數據建模中,演算法就是模型,程序是工具,而在業務層面上,演算法就是工具,業務邏輯才是模型。我們這裡主要從業務出發來闡述數據分析的工具與模型。

數據分析中,與數據處理直接相關的方法就是工具,指導將數據處理成何種結果的方法就是模型。數據升華的過程,需要藉助工具和模型的力量才能實現。數據分析工作中,數據和目標兩個要素主要是由外部條件決定的,自主發揮空間有限,因而工具和模型是數據分析工作的關鍵,是作為一名數據分析師的價值體現所在。

數據分析的工具:數據獲取工具、數據清理方法、基礎統計方法、機器學習演算法、統計軟體/程序、可視化工具、成果展示工具等。

數據分析的模型:思維模型、商業模型、業務分析模型

三、互聯網數據分析方法

1、互聯網數據分析一般目標:描述運營現狀,理解運營現象,預測未來趨勢,解決運營問題。首先需要對運營現象進行描述性認識,但絕非是簡單的數據或信息羅列,而是對數據進行解讀併產出結論性知識;理解是對運營現象的機理及變化原因的認識,是在描述基礎上進一步的深化認識;預測和決策則是前兩種認識的延伸,預測是認識在長時間維度上延伸而產生的推斷,而決策則是在廣度上延伸與業務邏輯結合輸出的行動建議。

2、互聯網數據特徵:俗稱大數據,經常被概括為4V。但大數據的「大」,更多不在於絕對的量級,而是佔比,即不用再利用抽樣方法去估計用戶,而是幾乎可以看到所有用戶,用戶的所有行為。互聯網數據以用戶行為數據為主,優點是客觀性、豐富性、覆蓋性、動態性,但同時也面臨噪音嚴重、結構性不足、相互割裂、缺乏深度的問題,因此需要花費大量精力進行數據清理工作。

3、互聯網數據分析方法——工具與模型

互聯網數據分析方法,在工具層面上去其他分析差別不大,區別主要集中於模型部分,尤其是業務分析模型,這其中最關鍵的就是對運營的了解。下面就先談一下個人對運營的理解,最後再上乾貨。哈!

四、對運營的理解

在我看來,互聯網產品本身是三位一體:產品、運營、用戶。其中產品的構成包括:功能(骨架)、內容(血肉)、價值(靈魂),功能即產品內一切程序或流程,內容即一切文字、圖片、音視頻等溝通媒介,價值即提供給用戶的有形商品或無形服務。價值需要通過功能和內容實現,也可能是功能或內容本身,如工具性產品。

而運營就是如何讓產品運轉,並讓更多的人、更頻繁、更持久、更深入的使用產品,在廣度、頻度、長度、深度上拓展產品生命。所以根本上講,運營包括了對產品的運營和對用戶的運營。產品運營中,功能、內容、價值是產品滿足用戶需求、供給用戶價值的依託,因此產品運營就是為了在產品開發之後能保持其持續正常的價值供給;而用戶運營則是,將產品價值傳達給用戶並讓用戶接受、喜歡產品的過程,使產品擁有人氣以實現價值轉化。活動、推廣、客服等則是運營工作具體展開的手段。運營工作就是通過這些手段, 一方面讓產品為用戶創造價值,另一方面吸引用戶提升產品活力並幫助產品優化升級,以此形成良性循環的過程。正如黃有璨所說,「產品負責界定和提供長期用戶價值,運營負責創造短期用戶價值+協助產品完善長期價值」。

五、互聯網數據分析方法 知識體系

下面就是我對互聯網數據分析中涉及的工具和模型所做的體系概括,當然,這裡面除了自己的數據分析實踐,更多是對前人的學習總結。

1、整體概括

2、詳細信息


推薦閱讀:

從2個用數據提升轉化的場景聊開去
站在風口與風險中的消費金融,未來如何發展| MobData
用Python讀紅樓夢之——二、詞雲美化
三大運營商去年平均日賺約3.65億 你貢獻了多少?
【知識精選NO.103】2017年12月,25份互聯網趨勢報告

TAG:數據分析 | 互聯網數據分析 | 數據化運營 |