簡單邏輯回歸
1,什麼是邏輯回歸;
1,邏輯回歸是按照特徵對某件事,事物進行分類,得到最終的標籤;比如喜歡/不喜歡。
2,再次明確特徵和標籤的區別。
1)比如聽一首歌;歌曲的強度,歌曲的長度,音調就是這個歌曲的特徵;我喜歡/不喜歡就是標籤
2)機器學習中要做的就是,根據我經常聽歌的習慣,通過對我聽過的歌曲的特徵進行採集分析,當我再次聽到一首歌時候,通過對這首歌的特徵分析,來分辨我喜不喜歡這首歌曲。
3,邏輯回歸用來做什麼。
答:用來尋找決策面,也就是喜歡和不喜歡的分界線,會把歌曲的特徵,標籤有一個劃分。
4,邏輯回歸的怎麼預測結果。
1)在一堆的數據中尋找一部分來做訓練模型,一部分來做測試模型;隨機取出,可用隨機抽樣函數sample來實現。通過訓練數據的訓練模型對測試數據進行預測。如下圖過程。
5,怎麼預測越決策的數據結果準確性,可以測試數據原有結果和預測結果比對,同樣的個數除以總個數就是個模型的正確率,一般情況下訓練模型的數據越大,模型越精確。
6,邏輯回歸的內在實際;
1)邏輯回歸其實就是二分分類,也可以理解為邏輯分類;操作過程為;
7,怎麼在R語言中實現邏輯分類;
1)邏輯回歸的函數是glm();假設有訓練數集是train,測試數集是test(泰坦尼克號為例)使用如下:
#訓練模型
model<- glm(Survived~.,data=train,family=binomial())下劃線會是泊松分布意思
#對測試數據進行預測
predict(model,test,type="response")
備註:不添加type="response」意味著預測的是可以倖存的邏輯概率,加上就是倖存的概率
#預測數據的精準性,可以採取混淆矩陣方法預測模型的精準度
8,為什麼叫做邏輯回歸,或者說為什麼叫回歸,因為他邏輯函數包含一個參數z;這個參數是由線性回歸函數構成的。如下,
9,分類和回歸的區別。
三個方面來說:1,輸出的類型不一樣,分類輸出的是離散數據,比如,喜歡不喜歡。回歸輸出的是連續數據,y=a+bx.
2,進行回歸和分類額區別;回歸是為了找到最佳擬合線,是一個連續型的線條;分類是為了知道一個邊界,也就是決策面。
3,準確性的評估:分類可以用正確率來評估模型的精準度,回歸用的是決定係數R平方(相關係數的平方)來判斷是否最佳擬合。
以上就是本次學習邏輯回歸的部分理解,請大家點評。
推薦閱讀:
※重磅,深度學習皮膚癌診斷達專家水平
※知乎問題標籤預測開放數據集上線啦
※第二章:機器學習對配電網健康指數分析
※《機器學習基石》課程學習總結(三)