人人都愛數據科學家!Python數據科學精華實戰課程系列教程連載 ----長期更新中,敬請關注!

連載完畢爬蟲系列,接下來連載Python數據科學家的體系,感謝關注。

昨天爬知乎的源碼:github.com/Germey/Zhihu

-------------------------------------2017年3月17日 更新 ------------------------------

主講老師:

丘祐瑋(David Chiu) – 大數軟體(LargitData)創辦人,是一位致力於提供輿情分析服務的創業者與數據科學家,熟悉Hadoop,Spark 等大數據平台,及擅長使用R,Python與機器學習技術進行數據分析。曾任多家上市公司顧問及擔任知名大數據應用程序競賽的評審,已編著MachineLearning With R Cookbook [Packt] 與 R Cookbook [Packt] 二書。

課程大綱:

第一章:Python與數據科學應用

1.數據科學簡介與應用 (更新完畢)

2.Python與數據科學(更新完畢)

3.安裝Anaconda

4.使用Jupyter Notebook

5.Python 3語法快速簡介

6、Python 資料分析套件 - Pandas 簡介

7.數據科學步驟詳解

8.實戰範例 - 使用Python計算文章中的字詞頻率

第二章:數據搜集實例

1.數據型態

2.結構化vs半結構化vs非結構化資料

3.Python IO與檔案處理

4.處理CSV, Excel格式資料

5.處理JSON, XML格式資料

6.撰寫網路爬蟲搜集網路資料

7.實戰範例 - 房天下(Fang.com)屋價資料搜集

第三章:資料清理(I)

1.資料清理概論

2.簡介Pandas -使用Pandas處理資料

3.資料篩選

4.偵測遺失值

5.補齊遺失值

6.實戰範例 - 房屋資料處理

第四章:資料清理(II)

1.資料轉換

2.處理時間格式資料

3.重塑資料

4.學習正規表達式

5.實戰範例 - 新聞資料處理

第五章:資料探索與資料視覺化

1.使用Pandas產生敘述性統計

2.如何使用Pandas繪製統計圖表

3.實戰範例 - 網頁瀏覽紀錄資料分析

第六章:資料儲存實例

1.關聯式資料庫- SQLite簡介

2.將資料儲存至資料庫中

3.使用SQL Query分析結構化資料

4.實戰範例 - 匯率資訊儲存與管理

第七章:使用機器學習建立數據模型(回歸模型)

1.機器學習基礎

2.Scikit-Learn套件簡介

3.監督式學習與非監督式學習

4.回歸分析

5.回歸模型評估

6.實戰範例 - 使用回歸模型分析房屋價格

第八章:使用機器學習建立數據模型(分類模型)

1.資料分類-決策樹

2.資料分類- Logistic Regression

3.資料分類- SVM

4.資料分類-類神經網路

5.資料分類-隨機森林

6.實戰範例 - 使用分類模型預測客戶流失

第九章:使用機器學習建立數據模型(驗證模型)

1.混淆矩陣(Confusion Matrix )與其意義

2.交叉驗證(Cross Validation)

3.使用ROC評估不同分類模型

4.實戰範例 - 評估不同客戶流失分析模型

第十章:使用機器學習建立數據模型(資料分群)

1.分群方法-階層式分群

2.分群方法- Kmeans分群

3.分群方法- DBScan分群

4.分群結果評估

5.實戰範例 - 利用分群找出文章主題

第十一章:使用機器學習建立數據模型(特徵篩選與降低維度)

1.特徵篩選(Feature Selection)

2.特徵萃取-PCA

3.特徵萃取-SVD

4.實戰範例 - 使用SVD 壓縮圖檔

第十二章:使用機器學習建立數據模型(關聯與頻繁樣式分析篇)

1.關聯分析(Association Rule)

2.頻繁樣式探勘(Frequent Pattern Mining)

3.實戰範例 - 購物籃分析實例

--------------------------3月17日 已更新完畢-------------------------

一、爬蟲

丘老師 -----------Python網路爬蟲實戰 Python網路爬蟲實戰 【免費視頻教程持續更新中】 此26課時已更新完畢!!

二、數據科學家連載狀態

1.數據科學簡介與應用 (更新完畢)

2.Python與數據科學(更新完畢)

-------------------------------更新通知及互動討論----------------------

喜歡就關注,持續更新。

大家也可以加小編微信:tszhihu (備註:Python),拉大家到 Python愛好者社區 微信群,可以跟各位老師互相交流。謝謝。

也可以關注微信公眾號:Python愛好者社區 (ID:python_shequ), 第一時間獲取視頻更新動態。


推薦閱讀:

Python3中BeautifulSoup的使用方法
用Python做Lorenz attrator的動畫模擬
靜覓博主:Python爬蟲學習系列教程
[3] Python數值
如何在阿里ECS雲端運行Jupyter Notebook進行機器/深度學習?

TAG:Python | 数据科学家 | 数据科学 |