Logistic regression是否能在大量有歧義的樣本中很好的學習到其概率分布?


用「分割平面」來稱呼Logistic regression的output,說明你把它跟SVM混淆了。對於一個input X,Logistic regression的output是一個estimated probability, as the parameter of the Bernoulli Y,如果underlying model是correctly specified,那麼sample size增長到無窮以後因為參數估計是漸進正確的,任意給定X擬合出的probability也會收斂到真實值。

但是即使Logistic regression能告訴你「給定X=X0」,大約80%的Y是1,它不能告訴你哪些Y是1.


可以,依據最大似然估計的一致性。當然前提是你的數據依logistic distribution分布。


推薦閱讀:

TAG:機器學習 | 概率 | 統計 | Logistic回歸 |