大巧若拙,隱藏在Data Analytics簡約外衣下的利器
來自專欄 DataHunter
Data Analytics簡介
Data Analytics是由DataHunter(北京數獵天下科技有限公司)自主研發的一款企業級業務數據可視化分析產品。其基於探索式分析技術,具備操作簡單、部署靈活、秒級響應等特點。Data Analytics可廣泛應用於各行各業,從百億級數據量的企業到各垂直中小企業,專註解決各行業的業務數據分析需求。
Data Analytics可以幫助企業搭建一站式的業務數據可視化分析平台,提供了從數據採集、數據處理、數據分析、數據可視化於一體的完整解決方案。Data Analytics致力於幫助企業快速了解業務狀況,及時發現問題進而改進業務。
常規分析
相比於驗證式分析,Data Analytics所採用的探索式分析模式,無需進行複雜的數據建模,系統就可以根據現有的業務數據特點,智能推薦可視化呈現方式,同時,Data Analytics支持豐富的交互方式,包括動態關聯分析、全維度數據鑽取、協同過濾等,使得業務人員或決策者可以自由地進行深度探索和分析,從而快速發現業務問題。
Data Analytics可以快速的將分析結果進行輸出,用戶在進行拖拽分析操作的同時,就可以同步看到分析結果。
客戶需求
某公司是知名消費品企業,採用SAP、ERP系統、傳統OLTP、Excel等多種混合結構存儲業務數據。
場景:希望採購一款時尚、易用、高效的BI產品來滿足日益增長的業務分析需求。
訴求點
客戶:『拖拖拽拽就完成常見的圖表製作,這些來參評的廠商都可以啊,我和他們談笑風生!你們得拿出點絕活才可以,blahblah…』
需要用最少的資源,拖上成噸的數據,跑出飛一般的感覺。
需要分析產品具備ETL功能,因為我們的數據來源不整齊,舉例說明:
這個表格,要求把『XX茶』都處理成『茶』,『芬達、可樂、蘆薈、冰露』都處理成『水』。
還有,這個表缺失日銷/節假日的佔比欄位,也需要自動完成。
之前的數據是這樣的:
(以下為樣本數據,和真實業務無關)
我們希望看到的數據是這樣嬸的:
還有哦,這列數據本來是圓形的,我希望把它變成方形的…
說到這裡,場下的廠商有的已經坐不住了:『呃,我們的ETL工程師今天沒在』,有的默默的祭出SQL大法。
Data Analytics實現示例
計算欄位
Data Analytics 有個功能,叫做計算欄位,在數據表格的右上角,打開就是這樣的:
看到這裡,是不是心裡一慌、一涼、一激靈?
上小學的時候函數就沒有學好,用你這產品給我補課?
別慌,老手都曾經是新生。
函數
首先看第一個,不同數據歸一化,選擇IF函數,如圖:
翻譯過來就是:如果目錄裡面包含『茶』字,就顯示成茶,否則顯示成『水』。
So easy,再也不用擔心數據不整齊導致被老闆罵。
再看第二個,就更簡單了,小學除法我會:
sale_count:平時銷量
holiday:假日銷量
div(平時銷量, 平時銷量)=佔比,是不是很方便呢?
上述增加的計算欄位,直接成為表格的一部分,可以像其他欄位一樣拖拖拽拽,讓美麗的圖表呈現你的智慧。
小結
以上的示例只是Data Analytics強大功能的冰山一角。
選擇一款好的數據分析產品,不僅要看出身,品味,還要考察其背後的各種細節。
Data Analytics還隱藏著許多凝聚設計師、分析師、程序猿的心血結晶,等著你來發掘。
推薦閱讀:
※「特徵工程」與「表示學習」
※2018 年大疆機器學習演算法工程師春季提前批筆試題
※數據分析之數據可視化
※一位數據分析師的一周工作,你的是什麼樣子的?
※論文 | 半監督學習下的高維圖構建