語音識別技術為何涉及心理學?
01-08
「語音識別技術涉及信號處理、物理學(聲學)、模式匹配、通信及信息理論、語言語音學、生理學和心理學。」這句話摘自百度百科,前面的幾個領域好理解,但最後一個心理學怎麼理解?
是的,百度百科是對的。語音識別技術屬於「心理物理學」中「心理聲學」的研究範圍。
我搜索了你引用的這句話,發現出處是「自動語音識別」詞條。那麼就舉一個與自動語音識別有關的例子。心理學家Colin Cherry在1953年提出的「雞尾酒會效應」不知你有沒有聽過,其實內容就是,當我們在雞尾酒會上與他人聊天時,即便周圍的環境很吵,我們的談話依然可以順利進行。而如果遠處有人叫你的名字,你也會很快反應。也就是說,我們會自動剝離與自己無關的聲音。研究人員需要研究如何通過工學實現這種效果,這就涉及「自動語音識別技術」中的「盲信號分離」技術。
參考:心理聲學雞尾酒會效應盲信號分離
推薦閱讀:
※導師讓做一個語音識別的系統,詳細步驟是什麼?
※聽力時,在距離音源較近的位置用較低的聲音播放,或在距離較遠的位置播放較大的聲音,分辨能力是否近似?
※訊飛和搜狗最近都在秀的實時翻譯,哪裡可以體驗到?
※如何從代碼角度對比評價HTK和KALDI的設計和可讀性?