標籤:

邏輯回歸學習

邏輯回歸學習

一.線性回歸與邏輯回歸的區別

線性回歸要求變數服從正態分布,logistic回歸對變數分布沒有要求。

線性回歸要求因變數是連續性數值變數,而logistic回歸要求因變數是分類型變數。

線性回歸要求自變數和因變數呈線性關係,而logistic回歸不要求自變數和因變數呈線性關係

logistic回歸是分析因變數取某個值的概率與自變數的關係,而線性回歸是直接分析因變數與自變數的關係

二、邏輯回歸

決策面:對於分類問題所產生的,用來劃分一個其輸入的數據屬於什麼分類。在用邏輯函數獲得概率值以後,概率大於0.5則特徵為1,反之概率等於0。

模型準確率:正確率=正確分類個數/數據總數

邏輯回歸:也叫二分分類:分類結果標籤只有兩個,如硬幣的正面或反面。之所以叫邏輯回歸,因為參數是一個回歸函數

邏輯函數:

三、數據的分類

數值數據(定量數據)

離散數據:數據取值不連續,數據與數據之間有明顯間隔

連續數據:某個範圍內,可取任意的數值

分類數據(定性數據)

對數據進行描述,他無法進行一種量化,如性別。我們可以用數值來表示男1女0

時間序列數據

時間序列是在一段時間內定期收集的序列,他最大的特點就是時間

四、回歸與分類的區別

五、練習


推薦閱讀:

「數據黑產」背後的個人信息保護合規問題探析
翻譯《R for Data Science》-chapter 1-1.1
Python : 商鋪數據清洗及存儲
學習數據分析要給自己訂一個計劃
SQL查詢實例

TAG:數據分析 |