機器學習之邏輯回歸分類
02-26
邏輯回歸實際上是一種分類,這個模型的標籤是分類結果。使用正確率來衡量模型,也就是給模型輸入測試數據集之後,模型結果中正確分類的預測數占測試數據中所有的比例。
其中需要注意的是,y表示的是當x對應的標籤為1的概率值。當概率值大於0.5時,歸類到1,當概率值小於0.5時,歸類到0.
邏輯回歸的Python實現
- 將原始數據集分為訓練數據集和測試數據集
- 畫散點圖來觀察數據
- 進行邏輯回歸建模
- 模型評估,得到準確率
給定一個x值,通過模型預測其標籤是0
前面是標籤為0的概率,後面是標籤為1的概率,通過決策面規則,我們可以知道0.63>0.5,屬於標籤等於1的分類,所以花費三小時學習的學生預測考試通過。
另外可以通過上面圖片給的公式得到另外一種預測的方法。
推薦閱讀:
※回顧與展望轉行數據科學路上的點點滴滴(2016-2018)
※數據分析實戰-數據分析職位分析
※清單|小白轉行數據分析
※重走數據分析之路 R In Action
※零基礎學習Python數據分析:數據處理模塊Pandas使用(4)