語音識別技術為何涉及心理學?

「語音識別技術涉及信號處理、物理學(聲學)、模式匹配、通信及信息理論、語言語音學、生理學和心理學。」這句話摘自百度百科,前面的幾個領域好理解,但最後一個心理學怎麼理解?


是的,百度百科是對的。語音識別技術屬於「心理物理學」中「心理聲學」的研究範圍。

我搜索了你引用的這句話,發現出處是「自動語音識別」詞條。那麼就舉一個與自動語音識別有關的例子。

心理學家Colin Cherry在1953年提出的「雞尾酒會效應」不知你有沒有聽過,其實內容就是,當我們在雞尾酒會上與他人聊天時,即便周圍的環境很吵,我們的談話依然可以順利進行。而如果遠處有人叫你的名字,你也會很快反應。也就是說,我們會自動剝離與自己無關的聲音。研究人員需要研究如何通過工學實現這種效果,這就涉及「自動語音識別技術」中的「盲信號分離」技術。

參考:

心理聲學

雞尾酒會效應

盲信號分離


推薦閱讀:

導師讓做一個語音識別的系統,詳細步驟是什麼?
聽力時,在距離音源較近的位置用較低的聲音播放,或在距離較遠的位置播放較大的聲音,分辨能力是否近似?
訊飛和搜狗最近都在秀的實時翻譯,哪裡可以體驗到?
如何從代碼角度對比評價HTK和KALDI的設計和可讀性?

TAG:人工智慧 | 心理學 | 語音識別 | Siri |