人人都愛數據科學家!Python數據科學精華實戰課程系列教程連載 ----長期更新中,敬請關注!
連載完畢爬蟲系列,接下來連載Python數據科學家的體系,感謝關注。
昨天爬知乎的源碼:https://github.com/Germey/Zhihu
-------------------------------------2017年3月17日 更新 ------------------------------主講老師:
丘祐瑋(David Chiu) – 大數軟體(LargitData)創辦人,是一位致力於提供輿情分析服務的創業者與數據科學家,熟悉Hadoop,Spark 等大數據平台,及擅長使用R,Python與機器學習技術進行數據分析。曾任多家上市公司顧問及擔任知名大數據應用程序競賽的評審,已編著MachineLearning With R Cookbook [Packt] 與 R Cookbook [Packt] 二書。
課程大綱:
第一章:Python與數據科學應用
1.數據科學簡介與應用 (更新完畢)
2.Python與數據科學(更新完畢)
3.安裝Anaconda
4.使用Jupyter Notebook
5.Python 3語法快速簡介
6、Python 資料分析套件 - Pandas 簡介
7.數據科學步驟詳解
8.實戰範例 - 使用Python計算文章中的字詞頻率
第二章:數據搜集實例
1.數據型態
2.結構化vs半結構化vs非結構化資料
3.Python IO與檔案處理
4.處理CSV, Excel格式資料
5.處理JSON, XML格式資料
6.撰寫網路爬蟲搜集網路資料
7.實戰範例 - 房天下(http://Fang.com)屋價資料搜集
第三章:資料清理(I)
1.資料清理概論
2.簡介Pandas -使用Pandas處理資料
3.資料篩選
4.偵測遺失值
5.補齊遺失值
6.實戰範例 - 房屋資料處理
第四章:資料清理(II)
1.資料轉換
2.處理時間格式資料
3.重塑資料
4.學習正規表達式
5.實戰範例 - 新聞資料處理
第五章:資料探索與資料視覺化
1.使用Pandas產生敘述性統計
2.如何使用Pandas繪製統計圖表
3.實戰範例 - 網頁瀏覽紀錄資料分析
第六章:資料儲存實例
1.關聯式資料庫- SQLite簡介
2.將資料儲存至資料庫中
3.使用SQL Query分析結構化資料
4.實戰範例 - 匯率資訊儲存與管理
第七章:使用機器學習建立數據模型(回歸模型)
1.機器學習基礎
2.Scikit-Learn套件簡介
3.監督式學習與非監督式學習
4.回歸分析
5.回歸模型評估
6.實戰範例 - 使用回歸模型分析房屋價格
第八章:使用機器學習建立數據模型(分類模型)
1.資料分類-決策樹
2.資料分類- Logistic Regression
3.資料分類- SVM
4.資料分類-類神經網路
5.資料分類-隨機森林
6.實戰範例 - 使用分類模型預測客戶流失
第九章:使用機器學習建立數據模型(驗證模型)
1.混淆矩陣(Confusion Matrix )與其意義
2.交叉驗證(Cross Validation)
3.使用ROC評估不同分類模型
4.實戰範例 - 評估不同客戶流失分析模型
第十章:使用機器學習建立數據模型(資料分群)
1.分群方法-階層式分群
2.分群方法- Kmeans分群
3.分群方法- DBScan分群
4.分群結果評估
5.實戰範例 - 利用分群找出文章主題
第十一章:使用機器學習建立數據模型(特徵篩選與降低維度)
1.特徵篩選(Feature Selection)
2.特徵萃取-PCA
3.特徵萃取-SVD
4.實戰範例 - 使用SVD 壓縮圖檔
第十二章:使用機器學習建立數據模型(關聯與頻繁樣式分析篇)
1.關聯分析(Association Rule)
2.頻繁樣式探勘(Frequent Pattern Mining)
3.實戰範例 - 購物籃分析實例
--------------------------3月17日 已更新完畢-------------------------
一、爬蟲
丘老師 -----------Python網路爬蟲實戰 Python網路爬蟲實戰 【免費視頻教程持續更新中】 此26課時已更新完畢!!
二、數據科學家連載狀態
1.數據科學簡介與應用 (更新完畢)
2.Python與數據科學(更新完畢)
-------------------------------更新通知及互動討論----------------------
喜歡就關注,持續更新。
大家也可以加小編微信:tszhihu (備註:Python),拉大家到 Python愛好者社區 微信群,可以跟各位老師互相交流。謝謝。
也可以關注微信公眾號:Python愛好者社區 (ID:python_shequ), 第一時間獲取視頻更新動態。
推薦閱讀:
※Python3中BeautifulSoup的使用方法
※用Python做Lorenz attrator的動畫模擬
※靜覓博主:Python爬蟲學習系列教程
※[3] Python數值
※如何在阿里ECS雲端運行Jupyter Notebook進行機器/深度學習?