面向數據科學家的兩門課:Data8 和 DS100

Data8:

https://data8.orgdata8.org

這個是完完全全的入門課,前半段講 Python,後半段講統計學的基本概念(假設檢驗、區間估計、貝葉斯、自舉等),並用 Python 模擬。可以看做數據科學版的 CS61a。

DS100:

DS100www.ds100.org

進階課,前半段講工具鏈,包括 SQL、正則、Pandas、Seaborn、Spark。後半段講機器學習的基本概念(過擬合、特徵工程等)和線性回歸、Logistic 回歸。

兩門課在 18 春季學期均有開課。

相關資料:

我最近翻譯的《計算與推斷思維》,其實是第一門課的課本,第二門課的參考書。

Kivy-CN/data8-textbook-zhgithub.com圖標

基於 Harvard CS109 和 UCB DS100 的數據科學導論筆記

iewaij/introDataSciencegithub.com圖標
推薦閱讀:

智能單元專欄目錄
Image Caption 深度學習方法綜述
機器學習演算法自動訓練工具Parris,消除你重複建堆棧的煩惱
非凸優化基石:Lipschitz Condition
Python vs R : 在機器學習和數據分析領域中的對比

TAG:数据科学 | Python | 机器学习 |