認識DAX數據分析語言
DAX的由來
從SQL Server 2012開始,微軟推出了SSAS Tabular Model ,從那以後,SSAS開始支持兩種模型:Multidimensional Model和Tabular Model.雖然它們共享部分代碼,但幾乎可以認為是兩種完全不同的產品,多維模型已經為人所熟知,而表格模型是一個比較新的概念,無法評價哪一個更好,因為它們有各自的使用場景和優劣,比較嚴謹的說法是:多維和表格模型互為補充。
表格模型的意義在於 提供了一套具備企業級資料庫分析性能的輕型工具(Excel Power Pivot、Power BI)和一門易於上手的分析語言DAX
DAX是什麼
DAX全稱 Data Analysis Expressions ,即數據分析表達式。是一門函數語言,用於SSAS表格模型,而Power Pivot和Power BI Desktop本質上運行的都是SSAS實例,只不過根據各自應用場景做了閹割。所以學會了DAX函數,可以方便的在Excel/Power BI/SSAS 三者之間切換,從自助BI到企業BI距離從未如此之近。
使用DAX推薦的硬體配置
工欲善其事必先利其器,經常看到群里有人抱怨PowerPiovt 報錯,除去一部分軟體自身的bug之外,有相當多的情況是由於電腦配置過低導致,所以有必要再次強調,想要獲得流暢的使用體驗,務必:
使用64位版本Office且內存不低於4G
DAX能處理多少數據
忽略使用32位版本的用戶,DAX可以處理的數據量由內存容量的上限決定,PowerPivot可以較為輕鬆的分析幾百萬行數據,具體的存儲量還取決於數據結構,與Access 2G的最大容量相比,PowerPivot不但存儲數據量更大,還具備關係資料庫的分析能力,完勝Access。
那麼具備完整DAX引擎的SSAS表格模型性能又如何呢?
- 1000萬行:無壓力
- 1億行:優化語句的效果開始顯現
- 10億行:考慮優化數據結構和檢查數據分片的大小
- 100億行:考慮執行不同粒度的聚合
- 1000億行:比較難搞,但也不是毫無辦法。
DAX知識體系
註:以下內容為個人總結,供參考
整體看來,可以將DAX知識體系劃分為分析師路線和專家路線,從業務線轉型的數據分析人員,掌握概念、函數和實戰套路這三章就可以開始體會到DAX的威力,顯著提升業務分析水平甚至「跨界攻擊」的能力。而如果想成為DAX專家,需要進一步掌握引擎內部運行機制和模型優化知識,以勝任操控企業級架構的能力。
一、認識DAX:入門閱讀
二、概念:DAX體系的基石,掌握高級DAX必備三、函數:基礎部分Excel用戶容易上手,高級函數DBA更熟悉
四、實戰:學以致用,從基礎到套路,難度大幅度提升五、DAX引擎:走上成為DAX專家的不歸路
六、模型優化
七、掌握DAX查詢機制
八、DAX調優:Highly Expensive
一句話總結:
Dax is easy to learn,very hard to master.
DAX函數易於學習,但非常難以掌握。
-----------------------------------------------------------------
入門必讀 系列文章 (更新完結)
自助式BI,全面提升你的數據分析能力
當我們談論Power BI的時候,我們在談論什麼
Power BI Desktop 對比 Tableau Desktop
從0開始學習PowerBI,可能遇到哪些問題
全面了解PowerQuery
PowerQuery的優勢與短板
認識DAX數據分析語言
推薦閱讀:
※桌面端無法登陸的調查原因及解決方案(2017.12.22更新)
※使用Power BI進行商品關聯性分析
※從0開始學習Power BI,可能遇到哪些問題
※Power Query新特性:你給答案,我來計算
※數據分析原理