SAS學習途徑與相關資源 – SAS商業分析
SAS可能是分析行業最常用的工具了。與其他工具比如R和Python相比,儘管有人可能對它的可持續性以及特徵有著不同的想法,但是有兩點是可以肯定的。那就是:
- 健康的市場份額 – SAS仍然佔據著最大的市場份額。哪怕是在像美國和英國這樣的高級市場,它的市場份額至少有40%。而像印度這樣的國家,它的市場份額會超過70%。
- 便於學習並且有著超棒的(資源)支持 – 在我所知道的工具中,SAS有資格被認為是最簡單易學的。語言簡單到連新手都能快速入門。
這兩個理由足夠讓剛剛進入這個行業的新手考慮學習SAS。點擊這個鏈接,http://www.analyticsvidhya.com/blog/2014/03/sas-vs-vs-python-tool-learn/ 你可以找到更多相關細節。
首先,為什麼要學習SAS?
點擊此鏈接,https://www.youtube.com/watch?v=ksp8CzIgb-E,有一個小視頻可以讓你了解一下學習SAS的用途。
第一步:下載並安裝SAS軟體
可以通過創建一個SAS文件來下載學校版本。你也需要下載VMWare或者Oracle 視圖工具箱。學校版本鏈接如下:http://www.sas.com/en_us/software/university-edition.html。
安裝提示:
- SAS學校版本目前只支持windows 64bit系統
- 你需要先下載VMWare播放器或者Oracle視圖工具箱,然後下載相應的SAS大學版本。
第二步:學習基本SAS
在http://sad.com有免費的基礎SAS培訓,通過這個培訓你可以在24小時內學習到SAS的基礎知識。
第三步:學習SQL
現在你在一定程度上了解了SAS基礎知識,現在你應該看一下另一種在SAS上處理數據的方式- PROC SQL。閱讀這篇文章可以幫助你理解PROC SQL如何用於處理數據。(Proc SQL和Data Step之間的比較)
如果你已經知道了SQL,你會感激SAS創建了PROC SQL。即使你不知道SQL,你可能也會覺得在SAS上進行日常數據管理工作很簡單。這篇SUGI文章也可以看一看:PROC SQL入門。如果你需要更細緻的教程,可以看看這個學習工具:http://www.sys-seminar.com/EE/Files/AdvancedSubqueriesinPROCSQL.pdf
第四步:學習描述統計學
現在讓我們開始統計學的學習。現在可以開始學習描述統計學的課程了(鏈接https://www.udacity.com/course/ud827)。這門課程用Excel來教你所以描述統計學的基礎知識。如果你已經知道這些知識,可以直接略過這一步。
課程任務:在Udacity課程的每個章節後面的習題應該在SAS上完成。從基礎SAS課程學到的知識應該足夠讓你完成這些習題。如果你需要具體的幫助,可以使用SAS文檔。
第五步:學習推理統計學
這個鏈接是學習推理統計學的課程(https://www.udacity.com/course/ud201)。這個課程使用Excel表格教你所有關於推理統計學,假設性檢測,T-檢測以及ANOVA的相關知識。如果你已經學過這些知識,可以直接略過這一步。
課程任務:在Udacity課程的每個章節後面的習題應該在Excel上完成。在下一步完成後,我們將重新溫習一下SAS課程。
第六步:在SAS學習ANOVA,線性回歸和邏輯回歸分析
http://sas.com上有相關培訓內容(鏈接:https://support.sas.com/edu/schedules.html?id=1979&ctry=US)
課程任務:課程里以及Udacity課程里都有有相關習題
如果你使用的是SAS大學版本,你需要略過步驟7.9和10。 SAS大學版本有版本限制,不能運行決策樹和時間序列建模。
第七步:學習決策樹
既然你知道了一些演算法,那就讓我們看看決策樹。這裡有兩篇解釋決策樹運行的相關文章:
- 決策樹 – 簡化版本http://www.analyticsvidhya.com/blog/2015/01/decision-tree-simplified/
- 決策樹演算法 – 簡化版本http://www.analyticsvidhya.com/blog/?p=12419&preview=true
這裡有一份指導如何在Enterprise Miner上運行決策樹的指南 http://www.iasri.res.in/sscnars/data_mining/3-Building%20Decision%20Trees%20using%20SAS.pdf。
這個是一篇關於在基礎SAS上執行決策樹的文章http://support.sas.com/resources/papers/proceedings10/094-2010.pdf。
第八步:分類歸併與分段
首先,先看看播放列表中前四個介紹K-平均值分類歸併的視頻https://www.youtube.com/watch?v=aiJ8II94qck&list=PLQbGGI2mvVjPPvWgs4hCR5FkXykzAu69S。然後讀一下從SAS上分類歸併的指南http://support.sas.com/documentation/cdl/en/statugclustering/61759/PDF/default/statugclustering.pdf。此外,你可以在這個章節查詢相關內容 http://www.math.wpi.edu/saspdf/stat/chap23.pdf。
第九步:學習時間序列預測
這個鏈接是學習時間序列預測的入門教程。你可以使用這個教程來使用SAS里的時間序列來預測。
第十步:學習IML
以下三個鏈接是一系列的文章。你可以通過這些文章快速了解IML:
- SAS IML介紹http://www.analyticsvidhya.com/blog/2014/10/proc-iml-matrix-handling-sas/
- PROC IML世界的將來發展http://www.analyticsvidhya.com/blog/2014/11/step-world-sas-iml/
- PROC IML在分析中的應用 http://www.analyticsvidhya.com/blog/2014/11/applications-sas-iml-analytics/
第十一步:學習SAS Macros
下面三個鏈接是一系列幫助你理解SAS Macros的文章。
- SAL Macro入門介紹
- SAS Macro條件語句和迭代語句
- SAS Macro功能介紹
其他關於SAS的有用資源:
- SAS小手冊
- ATS UCLA的學習之路
- 數據分析例子 – SAS具體話題實例
——本文由數據分析網翻譯組- 紀旭翻譯
推薦閱讀:
※如果,你也想讀數據分析......
※一個優秀的CGO應該具備哪些知識和技能?
※黃金周與口紅效應有什麼關係?
※華夏鄧白氏商業分析員這工作怎麼樣?