簡單邏輯回歸

05-14

1，什麼是邏輯回歸；

1，邏輯回歸是按照特徵對某件事，事物進行分類，得到最終的標籤；比如喜歡/不喜歡。

2，再次明確特徵和標籤的區別。

1)比如聽一首歌；歌曲的強度，歌曲的長度，音調就是這個歌曲的特徵；我喜歡/不喜歡就是標籤

2)機器學習中要做的就是，根據我經常聽歌的習慣，通過對我聽過的歌曲的特徵進行採集分析，當我再次聽到一首歌時候，通過對這首歌的特徵分析，來分辨我喜不喜歡這首歌曲。

3，邏輯回歸用來做什麼。

答：用來尋找決策面，也就是喜歡和不喜歡的分界線，會把歌曲的特徵，標籤有一個劃分。

4，邏輯回歸的怎麼預測結果。

1）在一堆的數據中尋找一部分來做訓練模型，一部分來做測試模型；隨機取出，可用隨機抽樣函數sample來實現。通過訓練數據的訓練模型對測試數據進行預測。如下圖過程。

5，怎麼預測越決策的數據結果準確性，可以測試數據原有結果和預測結果比對，同樣的個數除以總個數就是個模型的正確率，一般情況下訓練模型的數據越大，模型越精確。

6，邏輯回歸的內在實際；

1）邏輯回歸其實就是二分分類，也可以理解為邏輯分類；操作過程為；

7，怎麼在R語言中實現邏輯分類；

1）邏輯回歸的函數是glm()；假設有訓練數集是train，測試數集是test（泰坦尼克號為例）使用如下：

#訓練模型

model<- glm（Survived~.,data=train,family=binomial（））下劃線會是泊松分布意思

#對測試數據進行預測

predict（model,test,type="response"）

備註：不添加type="response」意味著預測的是可以倖存的邏輯概率，加上就是倖存的概率

#預測數據的精準性，可以採取混淆矩陣方法預測模型的精準度

8，為什麼叫做邏輯回歸，或者說為什麼叫回歸，因為他邏輯函數包含一個參數z；這個參數是由線性回歸函數構成的。如下，

9，分類和回歸的區別。

三個方面來說：1，輸出的類型不一樣，分類輸出的是離散數據，比如，喜歡不喜歡。回歸輸出的是連續數據，y=a+bx.

2,進行回歸和分類額區別；回歸是為了找到最佳擬合線，是一個連續型的線條；分類是為了知道一個邊界，也就是決策面。

3，準確性的評估：分類可以用正確率來評估模型的精準度，回歸用的是決定係數R平方(相關係數的平方)來判斷是否最佳擬合。

以上就是本次學習邏輯回歸的部分理解，請大家點評。