杏仁核在強化學習中扮演著重要角色

03-02

學習是生物體適應環境變化的行為表現。通過學習，個體可以增加對營養的攝入，盡量避免傷害等。強化學習是學習當前時刻和一段時間內對周圍環境的選擇與獎賞或懲罰之間的關係的過程。個體通過不斷的學習來做出選擇，該選擇可以使個體獲得最大的獎賞，或者減少受到懲罰的次數。

過去基於強化學習的模型大多假設能夠預測誤差（誤差是指期待結果和真實結果的差異，比如完成一個任務你的期待報酬是 10 元錢，但實際只拿到了7元錢，這裡的誤差就是 3 元錢）的多巴胺引起了前額—紋狀體（frontal-striatal）迴路的可塑性。其中紋狀體對價值進行編碼進而驅使個體做出決策。

然而，3 月 29 日在線發表在 Nature Neuroscience 上的 Motivational neural circuits underlying reinforcement learning 一文表明，杏仁核也在強化學習的過程中起著非常重要的作用。

文章的作者是來自國立衛生研究院（National Institutes of Health, NIH）的 Averbeck 和 Costa，文章以綜述的形式對杏仁核和紋狀體共同參與強化學習這一過程進行了闡述，著重強調了杏仁核的重要作用。

研究表明，紋狀體也許在某種程度上接收到了杏仁核傳入的信息，如下圖所示，因此，紋狀體可能不像之前人們所想的那樣在強化學習中有那麼重要的地位。

杏仁核在強化學習中對紋狀體的信息輸入示意圖

雖然杏仁核損傷後學習的過程仍可以繼續，但僅依靠紋狀體的學習過程中學習率可能會受到影響。

作者認為，現有的強化學習抽象模型和計算模型應依照現有的研究結果進行修改，在模型中加入杏仁核和紋狀體的連接，杏仁核可能比紋狀體在強化學習中起著更重要的作用。

本文為原創編譯，轉載務必註明出處，謝謝！

微信公眾號：腦與智能