Logistic regression是否能在大量有歧義的樣本中很好的學習到其概率分布?
12-06
用「分割平面」來稱呼Logistic regression的output,說明你把它跟SVM混淆了。對於一個input X,Logistic regression的output是一個estimated probability, as the parameter of the Bernoulli Y,如果underlying model是correctly specified,那麼sample size增長到無窮以後因為參數估計是漸進正確的,任意給定X擬合出的probability也會收斂到真實值。
但是即使Logistic regression能告訴你「給定X=X0」,大約80%的Y是1,它不能告訴你哪些Y是1.可以,依據最大似然估計的一致性。當然前提是你的數據依logistic distribution分布。
推薦閱讀:
TAG:機器學習 | 概率 | 統計 | Logistic回歸 |