MATLAB的數據分析工具鏈
來自專欄 MATLAB
記者: live script+table給你什麼樣的感覺? 相比比較流行的python數據工具鏈呢?
菡姐: live script + table給我的感覺呢?感覺比jupyter notebook + pandas好多了!MATLAB有workspace, jupyter notebook沒有, 就好比汽車沒有碼速表一樣!
spyder也有workspace, 但是它不能顯示所有的數據類型, 而且數據量一大, 容易卡死.哎呦, 我超喜歡玩MATLAB的!
最近用MATLAB做了一個機器學習的項目.
感慨MATLAB最近幾年在數據分析領域上的進步, 現在已經非常適用於做數據分析了.
我總結了一下MATLAB的數據分析工具鏈:
table + live script + 統計與機器學習工具箱 + 神經網路工具箱
我之前用pyhon做數據分析, 就用它來解釋一下這個工具鏈好了.
1 table相當於python的pandas.
用它來做數據預處理是極好的.
熟悉pandas的讀者看看, 是不是具備了pandas的主要功能了呢?
2 live script相當於ipython notebook(最近好像改名叫Jupyter notebook了)
很適合以下場景:
1 生成可互動式報告.
2 打草稿, 邊看邊做.
3 優化參數.
相當於可以跑代碼的word或者ppt.
3 統計與機器學習工具箱相當於python的scikit-learn
之所以這麼類比, 是因為它們兩個都是1 具備大部分常見的機器學習模型 2 都不包括深度學習模型.
最近用了一下這個工具箱, 感覺不錯.
最大的感受: 各個模型的API統一了. 這是老版本的MATLAB不具備的.
4 神經網路工具箱相當於Python的眾深度學習包
以前神經網路工具箱裡面都是比較傳統的神經網路模型, 最近幾年, 添加了很多深度學習模型, 傳統的神經網路模型快要處於邊緣地位了.
題外話:
說實話, MATLAB的這套工具鏈是對應的Python工具鏈的"簡配版". 但是我還是更願意使用MATLAB的這套工具鏈. "簡配版"的意思是: 使用方便但是功能不夠多.
為什麼呢?
MATLAB是我的"母語", Python是我的"外語", 就這麼簡單, 哈哈.
實戰案例:
菡姐:使用MATLAB數據分析工具鏈進行實戰: 看電影真的是男女有別推薦閱讀:
※江湖險惡,不行就撤
※用戶畫像就是這樣簡單
※雨沐田:PowerPivot 用戶購買行為多表關聯分析
※不識廬山真面目,只緣身在此山中
※(7)Python初入坑之pandas基礎實操六