如何向外行人解釋模式識別和機器學習中的 Generalization 機制?


舉個例子:

我現在有這樣一個問題:用什麼方法可以挑選到又甜又熟的西瓜?

在嘗瓜無數(選瓜訓練數據)後,此題下答題的各位各有心得(選瓜模型),於是我按照各位的方法去市場上挑西瓜了,每個方法各挑20個(選瓜測試數據),最後發現得票最高的傢伙的方法挑出來的瓜19個都是甜熟瓜,而其它方法挑出來的瓜中甜熟瓜都沒有他的多。

這時候,我們就可以說在這次測試中這傢伙的選瓜心得的 generalization ability(泛化能力) 最好。


比方說,小孩子學習認識動物的時候,媽媽指著自家養的雞說,這是雞,黃毛雞,白毛雞什麼的;指著自家養的貓說,這是貓,白貓,黑貓什麼的。

然後孩子就記住了,這是我們家的雞,這是我們家的貓。

然後媽媽領孩子去鄰居家,鄰居家也有雞,黃毛,白毛的雞,孩子認識,換隻黑毛的,不認識了;

鄰居家也有貓,黑貓,白貓認得,換隻花貓,不認識是貓了,這就是泛化能力差。

如果孩子能夠提取中最重要的特徵,忽略掉次要特徵,比如毛的花色,看了自己家的動物,就能夠認出別人家的動物,這就叫泛化能力好。

稍微形式化一點講,就是在測試集上取得和訓練集上一樣的識別率。


比如:你叫 張小明

泛化:你叫 張x明


1.抓住主要特徵,忽略次要特徵

2.在訓練集上表現好,在測試集上表現也很好


推薦閱讀:

有沒有值得推薦的隨機森林 Random Forest教材?
EM演算法怎麼用在聚類上?
機器視覺需要學習哪些數學知識?
圖像金字塔除了sift演算法之外還有什麼應用?
ICCV2015 有什麼值得關注的亮點?

TAG:人工智慧 | 機器學習 | 模式識別 |