面向數據科學家的兩門課:Data8 和 DS100
01-28
Data8:
https://data8.org這個是完完全全的入門課,前半段講 Python,後半段講統計學的基本概念(假設檢驗、區間估計、貝葉斯、自舉等),並用 Python 模擬。可以看做數據科學版的 CS61a。
DS100:
DS100
進階課,前半段講工具鏈,包括 SQL、正則、Pandas、Seaborn、Spark。後半段講機器學習的基本概念(過擬合、特徵工程等)和線性回歸、Logistic 回歸。
兩門課在 18 春季學期均有開課。
相關資料:
我最近翻譯的《計算與推斷思維》,其實是第一門課的課本,第二門課的參考書。
Kivy-CN/data8-textbook-zh
基於 Harvard CS109 和 UCB DS100 的數據科學導論筆記
iewaij/introDataScience推薦閱讀:
※智能單元專欄目錄
※Image Caption 深度學習方法綜述
※機器學習演算法自動訓練工具Parris,消除你重複建堆棧的煩惱
※非凸優化基石:Lipschitz Condition
※Python vs R : 在機器學習和數據分析領域中的對比