孩子是怎麼學會數數的認知模型 | 枝蔚論文庫0513

孩子是怎麼學會數數的認知模型 | 枝蔚論文庫0513

來自專欄認知與計算的實證科學

本期文章:Bootstrapping in a language of thought: A formal model of numerical concept learning — Steven T. Piantadosi , Joshua B. Tenenbaum , Noah D. Goodman

1 孩子學習數數的過程

數數是一項挺困難的任務。不同於認字,只是把音、型、意對應起來的分類器,數數還需要一個遞推的概念:即使生活中從沒出現過「576」這個數字,當你掌握規矩後,見到它既可理解其含義。

那麼孩子是怎麼學會數數的?發展心理學家仔細觀察過這個過程。

第一步:背誦數列,可以數到6;但說是背誦,因為她說「1、2、3、4、5」和說「白、日、依、山、盡」的感覺是一樣的——都不懂。

第二步:有了數量的概念。比如成為「2-knower」,即當你問孩子要1個或2個玩具,她可以準確地遞給你;如果要3個,她就遞給你一把,會比2多,多幾個不定。同理,接下來的一年內,孩子會逐漸變成「3-knower」、「4-knower」。

第三步,通常是在4-knower之後,3-6歲期間,突然會有認知飛躍:不再是一個一個數字去學,而是突然能明白所有數字的含義,這叫做「cardinal-principle knower」(理解基數原理)。

如何理解到這個抽象的規律,從而通關理解所有的概念,這是孩子成長中很神奇的一個功能,也是基於個例去學習的AI不具備的功能。

2 用計算認知模型來描述

先問,當孩子處於上述每一個階段時,他們在談論每一個數字時的內心戲(心理表徵)是什麼樣?

作者總結了前人尤其是Susan Carey等發展心理學家的觀點,區分了兩種不同的認知能力:「分化物體個體」,到「自我遞推」bootstrap(怎麼翻譯??)的能力:

For instance, two-knowers might have a mental model of 『『one』』 as {X} and 『『two』』 as {X, X}. These representations rely on children』s ability for enriched parallel individuation, a representational capacity that Le Corre and Carey (2007) argue can individuate objects, manipulate sets, and compare sets using one-to-one correspondence.

In bootstrapping, the transition to CP-knower occurs when children notice the simple relationship between their first few mental models and their memorized count list of number words: by moving one element on the count list, one more element is added to the set represented in the mental model. Children then use this abstract rule to bootstrap the meanings of other number words on their count list, recursively defining each number in terms of its predecessor.

要進化到CP-knower,孩子需要把兩件事對應起來:已經背誦好的數字列表(1、2、3、4、5)和內心的集合。數字列表往前多數一個(2->3),集合中就多加一個元素({X,X} -> {X,X,X})。

數學上如何表達這些認知功能?本文作者引入了一些基本函數:

不光適用於數字學習,在大量其它研究中也用到,可能是人腦具備的「基礎功能」(primitive function)。

基於這些函數,我們可以把不同的認知階段用演算法來表述。

比如只能數到二的2-knower:

真正學會數數的cp-knower:

3 模擬學習數數的發展過程

首先,學習的數據哪裡來?即,孩子在什麼樣的場景中學習數數?作者給出的任務大概是一個物體列表,比如{黃狗,黑貓,橘貓,斑點狗,白貓},如果問有幾隻{貓},父母會教你說{2隻貓},這是正確答案。上述談論的模型對於一個物體列表,則會給出不同的回答,孩子最終的目的是學會一個模型可以在最多的生活場景中給出正確回答。

但注意,並不是什麼樣的物體列表都同樣可能。生活中絕大多數時候我們說「給我一個蘋果」、「那兒有一個球」,即「1」這個數字出現在孩子的訓練數據中頻率遠高於其它數字。為了客觀評估各個數字出現的可能性,作者扒了CHILDES資料庫 (MacWhinney, 2000)中20-40個月的孩子的對話文本,得到了如下統計,據此構造了訓練數據集。

並不意外地,作者使用貝葉斯公式給出各個模型的後驗可能性。likelihood比較好算,先驗概率prior中作者使用了兩個原則:越簡單的句法prior越高(所以1-knower肯定比2-knower有更高prior),包含遞歸recursion越少的句法prior越高(所以CP-knower的prior更低)。我理解這個prior大概類似於兒童學會這種規則的有多容易;作者解釋為什麼要單拎出來遞歸也是說,遞歸至少需要一定的記憶儲存能力,顯然會對兒童來說更困難。

4 結果

毫不意外地,作者成功復現了嬰兒學習數字的次序!

Fig 3a

總結一下,之所以能夠用計算認知模型復現兒童學習數數的過程,作者抓住了核心關節:數據集的特色(小數字多,越大數字越罕),演算法的基礎函數(對應基本認知功能),函數的先驗可能性(易學程度)。

這個任務本身對於計算機來說似乎很少見,沒見過哪個AI演算法需要學會數數的。往大了說,雖然所有的演算法都必然基於數學,但是AI本機能否理解數學的「概念」?這方面研究似乎甚少。


推薦閱讀:

計算與認知|枝蔚的論文庫0402
弱小和無知不是生存的障礙,傲慢才是!
人工智慧助力神經科學:DeepMind 復現大腦空間導航方式!
好奇心驅動的強化學習:從資訊理論開始
人腦的設計缺陷

TAG:認知科學 | 發展心理學 | 人工智慧 |