10倍速處理你的運營數據,這12個功能可以幫到你(上)
5 人贊了文章
做運營總要學一些數據分析,越是高級運營,其對數據也往往越敏感,其對數據的運用能力也往往越深入。今天分享的數據處理方面的內容,尤其適用於在運營一途上,剛開始接觸數據,但又希望用數據幫助自己成為高手的小夥伴們,這12個功能,讓你比使用Excel快10倍的處理數據,從而用更高品質的數據,將更長的時間放在運營思考上。
我們使用的工具是數據觀,重點用到的功能模塊是函數表達式和在線ETL,在這篇我們先從函數表達式說起。
函數表達式
很多人都用過Excel中的函數表達式,不過菜鳥一般就用些sum、count、left、right之類的函數,頂多用到vlookup、if函數,而高手們則能藉助嵌套函數實現一票牛X的自動計算。在數據觀中,也有函數,不過這裡的函數採用的是SQL的寫法。
在圖表設計時,通過「添加欄位」,可以調出函數編輯器,如下圖:
調出函數編輯器後,我們就可以編寫函數公式了,基本操作方法,可參看在數據觀中計算年齡用什麼函數表達式中的操作過程,這裡我們主要分享6個運營數據處理時常用的函數。
1、Case when
在處理百度統計實時訪客數據時,case when 函數多用來對來源欄位進行歸類,以便於查看,以下3種表達形式就是在處理訪客來源時最常用的:
CASE
WHEN [來源] in (『必應』,『Bing』,『Google』,『搜狗』)THEN 『搜索引擎』 WHEN [來源]=『直接訪問』 THEN 『直接訪問』 WHEN [來源] like 『%zhihu%』 THEN 『知乎 ELSE [來源] ENDIn:滿足其中任意條件,均會顯示 then後面的內容
=:欄位需要完全匹配,才會顯示 then 後面的內容Like 』%x%』:是正則表達式的一種匹配方式,簡單講相當於「包含」的效果,只要欄位中包含x字元,就會顯示then後面的內容
2、Replace
相當於Excel中的替換。
表達方式:REPLACE([欄位],『被替換的字元』,『用於替換的字元)
如:REPLACE([訪問時長],s,) 即:用空值替換「s」字元,效果如下圖
3、Datediff
DATEDIFF([最後登錄時間],[註冊時間]) 效果:「最後登錄時間-註冊時間」的天數
DATEDIFF(SYSDATE(),[註冊時間]) 效果:「當前時間-註冊時間」的天數
4、Substring
常用於截取欄位,更適用於類似提取身份證中特定位置的數字,以及對詳細地址中的省、市、縣等進行拆分
SUBSTRING([入口頁面],9)
這裡的「9」意味著左側數第9位開始截取,保留其右邊的字元(包含第9位的字元)
5、Substring_index
常用於截取欄位,更適用截取網址等字元位置不定,但有一定規則的欄位
SUBSTRING_INDEX ([入口頁面],//,-1)
註://指的是要截取的字元,-1意味著從左側數第1位,保留其右邊的字元;數字的正負,意味著是保留左側的欄位還是保留右側的欄位。
6、Nullif
NULLIF([企業成員郵箱],[企業創建人郵箱])
如果後面的欄位與前面的欄位一致,則為空值,不一致,則返回前面欄位的值
推薦閱讀:
※Python數據分析與數據化運營:會員數據化運營2-應用場景與分析模型
※物流分析法寶之一-數據分析
※如何利用槓桿思維,撬動這塊產品市場兩不管地帶?| 公開課筆記
※數據分析 練手項目
※0011數據處理:重複數據處理之COUNTIF函數的用法