認識DAX數據分析語言

DAX的由來

從SQL Server 2012開始,微軟推出了SSAS Tabular Model ,從那以後,SSAS開始支持兩種模型:Multidimensional Model和Tabular Model.雖然它們共享部分代碼,但幾乎可以認為是兩種完全不同的產品,多維模型已經為人所熟知,而表格模型是一個比較新的概念,無法評價哪一個更好,因為它們有各自的使用場景和優劣,比較嚴謹的說法是:多維和表格模型互為補充。

表格模型的意義在於 提供了一套具備企業級資料庫分析性能的輕型工具(Excel Power Pivot、Power BI)和一門易於上手的分析語言DAX

DAX是什麼

DAX全稱 Data Analysis Expressions ,即數據分析表達式。是一門函數語言,用於SSAS表格模型,而Power Pivot和Power BI Desktop本質上運行的都是SSAS實例,只不過根據各自應用場景做了閹割。所以學會了DAX函數,可以方便的在Excel/Power BI/SSAS 三者之間切換,從自助BI到企業BI距離從未如此之近。

使用DAX推薦的硬體配置

工欲善其事必先利其器,經常看到群里有人抱怨PowerPiovt 報錯,除去一部分軟體自身的bug之外,有相當多的情況是由於電腦配置過低導致,所以有必要再次強調,想要獲得流暢的使用體驗,務必:

使用64位版本Office且內存不低於4G

DAX能處理多少數據

忽略使用32位版本的用戶,DAX可以處理的數據量由內存容量的上限決定,PowerPivot可以較為輕鬆的分析幾百萬行數據,具體的存儲量還取決於數據結構,與Access 2G的最大容量相比,PowerPivot不但存儲數據量更大,還具備關係資料庫的分析能力,完勝Access。

那麼具備完整DAX引擎的SSAS表格模型性能又如何呢?

  • 1000萬行:無壓力

  • 1億行:優化語句的效果開始顯現

  • 10億行:考慮優化數據結構和檢查數據分片的大小

  • 100億行:考慮執行不同粒度的聚合

  • 1000億行:比較難搞,但也不是毫無辦法。

DAX知識體系

註:以下內容為個人總結,供參考

整體看來,可以將DAX知識體系劃分為分析師路線和專家路線,從業務線轉型的數據分析人員,掌握概念、函數和實戰套路這三章就可以開始體會到DAX的威力,顯著提升業務分析水平甚至「跨界攻擊」的能力。而如果想成為DAX專家,需要進一步掌握引擎內部運行機制和模型優化知識,以勝任操控企業級架構的能力。

一、認識DAX:入門閱讀

二、概念:DAX體系的基石,掌握高級DAX必備

三、函數:基礎部分Excel用戶容易上手,高級函數DBA更熟悉

四、實戰:學以致用,從基礎到套路,難度大幅度提升

五、DAX引擎:走上成為DAX專家的不歸路

六、模型優化

七、掌握DAX查詢機制

八、DAX調優:Highly Expensive

一句話總結:

Dax is easy to learn,very hard to master.

DAX函數易於學習,但非常難以掌握。

-----------------------------------------------------------------

入門必讀 系列文章 (更新完結)

  1. 自助式BI,全面提升你的數據分析能力

  2. 當我們談論Power BI的時候,我們在談論什麼

  3. Power BI Desktop 對比 Tableau Desktop

  4. 從0開始學習PowerBI,可能遇到哪些問題

  5. 全面了解PowerQuery

  6. PowerQuery的優勢與短板

  7. 認識DAX數據分析語言

推薦閱讀:

桌面端無法登陸的調查原因及解決方案(2017.12.22更新)
使用Power BI進行商品關聯性分析
從0開始學習Power BI,可能遇到哪些問題
Power Query新特性:你給答案,我來計算
數據分析原理

TAG:PowerBI | 商业智能BI | 数据分析工具 |