標籤:

如何自己寫個語音識別系統?

不用別人的引擎。自己寫一個能識別幾十個詞就行。請會的人講下思路好嗎?謝謝


我來拋磚引玉吧。

首先你要確定自己是要實現一個連續語音識別系統還是一個孤立詞語音識別系統。孤立詞語音識別更簡單一些,但主要的原理還是隱馬爾可夫模型(hidden markov model)和混合高斯模型(mixture gaussian model)。孤立詞語音識別網上有一份開源的MATLAB代碼,可以看看:

HMM Speech Recognition in Matlab

另外,既然要自己寫的話肯定要知道基本的原理,參考資料是HTK book:

http://speech.ee.ntu.edu.tw/homework/DSP_HW2-1/htkbook.pdf

有了這些知識,再參照已有代碼寫一個簡單的系統應該是沒有問題的。


找人錄語音,並建立語音資料庫,前提這些語音,你得剪輯成完好的語音片段。然用htk,就可以了


找一堆人錄語料 之後用htk 哦了


推薦閱讀:

能否訓練一個狗語 AI,讓它理解我的狗在對我說什麼?
語音識別中區分性訓練(Discriminative Training)和最大似然估計(ML)的區別?
語音識別出現過哪些有趣的「Bug」或失誤?
研一剛接觸語音識別,怎麼運用kaldi工具箱做一個baseline?

TAG:語音識別 |