機器學習之邏輯回歸分類

邏輯回歸實際上是一種分類,這個模型的標籤是分類結果。使用正確率來衡量模型,也就是給模型輸入測試數據集之後,模型結果中正確分類的預測數占測試數據中所有的比例。

其中需要注意的是,y表示的是當x對應的標籤為1的概率值。當概率值大於0.5時,歸類到1,當概率值小於0.5時,歸類到0.

邏輯回歸的Python實現

  • 將原始數據集分為訓練數據集和測試數據集

  • 畫散點圖來觀察數據

  • 進行邏輯回歸建模

  • 模型評估,得到準確率

給定一個x值,通過模型預測其標籤是0

前面是標籤為0的概率,後面是標籤為1的概率,通過決策面規則,我們可以知道0.63>0.5,屬於標籤等於1的分類,所以花費三小時學習的學生預測考試通過。

另外可以通過上面圖片給的公式得到另外一種預測的方法。

推薦閱讀:

回顧與展望轉行數據科學路上的點點滴滴(2016-2018)
數據分析實戰-數據分析職位分析
清單|小白轉行數據分析
重走數據分析之路 R In Action
零基礎學習Python數據分析:數據處理模塊Pandas使用(4)

TAG:數據分析 | 機器學習 |