簡單邏輯回歸

1,什麼是邏輯回歸;

1,邏輯回歸是按照特徵對某件事,事物進行分類,得到最終的標籤;比如喜歡/不喜歡。

2,再次明確特徵和標籤的區別。

1)比如聽一首歌;歌曲的強度,歌曲的長度,音調就是這個歌曲的特徵;我喜歡/不喜歡就是標籤

2)機器學習中要做的就是,根據我經常聽歌的習慣,通過對我聽過的歌曲的特徵進行採集分析,當我再次聽到一首歌時候,通過對這首歌的特徵分析,來分辨我喜不喜歡這首歌曲。

3,邏輯回歸用來做什麼。

答:用來尋找決策面,也就是喜歡和不喜歡的分界線,會把歌曲的特徵,標籤有一個劃分。

4,邏輯回歸的怎麼預測結果。

1)在一堆的數據中尋找一部分來做訓練模型,一部分來做測試模型;隨機取出,可用隨機抽樣函數sample來實現。通過訓練數據的訓練模型對測試數據進行預測。如下圖過程。

5,怎麼預測越決策的數據結果準確性,可以測試數據原有結果和預測結果比對,同樣的個數除以總個數就是個模型的正確率,一般情況下訓練模型的數據越大,模型越精確。

6,邏輯回歸的內在實際;

1)邏輯回歸其實就是二分分類,也可以理解為邏輯分類;操作過程為;

7,怎麼在R語言中實現邏輯分類;

1)邏輯回歸的函數是glm();假設有訓練數集是train,測試數集是test(泰坦尼克號為例)使用如下:

#訓練模型

model<- glm(Survived~.,data=train,family=binomial())下劃線會是泊松分布意思

#對測試數據進行預測

predict(model,test,type="response")

備註:不添加type="response」意味著預測的是可以倖存的邏輯概率,加上就是倖存的概率

#預測數據的精準性,可以採取混淆矩陣方法預測模型的精準度

8,為什麼叫做邏輯回歸,或者說為什麼叫回歸,因為他邏輯函數包含一個參數z;這個參數是由線性回歸函數構成的。如下,

9,分類和回歸的區別。

三個方面來說:1,輸出的類型不一樣,分類輸出的是離散數據,比如,喜歡不喜歡。回歸輸出的是連續數據,y=a+bx.

2,進行回歸和分類額區別;回歸是為了找到最佳擬合線,是一個連續型的線條;分類是為了知道一個邊界,也就是決策面。

3,準確性的評估:分類可以用正確率來評估模型的精準度,回歸用的是決定係數R平方(相關係數的平方)來判斷是否最佳擬合。

以上就是本次學習邏輯回歸的部分理解,請大家點評。


推薦閱讀:

重磅,深度學習皮膚癌診斷達專家水平
知乎問題標籤預測開放數據集上線啦
第二章:機器學習對配電網健康指數分析
《機器學習基石》課程學習總結(三)

TAG:數據分析 | 機器學習 |