如何向外行人解釋模式識別和機器學習中的 Generalization 機制？

01-08

舉個例子：

我現在有這樣一個問題：用什麼方法可以挑選到又甜又熟的西瓜？

在嘗瓜無數（選瓜訓練數據）後，此題下答題的各位各有心得（選瓜模型），於是我按照各位的方法去市場上挑西瓜了，每個方法各挑20個（選瓜測試數據），最後發現得票最高的傢伙的方法挑出來的瓜19個都是甜熟瓜，而其它方法挑出來的瓜中甜熟瓜都沒有他的多。

這時候，我們就可以說在這次測試中這傢伙的選瓜心得的 generalization ability（泛化能力）最好。

比方說，小孩子學習認識動物的時候，媽媽指著自家養的雞說，這是雞，黃毛雞，白毛雞什麼的；指著自家養的貓說，這是貓，白貓，黑貓什麼的。

然後孩子就記住了，這是我們家的雞，這是我們家的貓。

然後媽媽領孩子去鄰居家，鄰居家也有雞，黃毛，白毛的雞，孩子認識，換隻黑毛的，不認識了；

鄰居家也有貓，黑貓，白貓認得，換隻花貓，不認識是貓了，這就是泛化能力差。

如果孩子能夠提取中最重要的特徵，忽略掉次要特徵，比如毛的花色，看了自己家的動物，就能夠認出別人家的動物，這就叫泛化能力好。

稍微形式化一點講，就是在測試集上取得和訓練集上一樣的識別率。

比如：你叫張小明

泛化：你叫張x明

1.抓住主要特徵，忽略次要特徵

2.在訓練集上表現好，在測試集上表現也很好