2014-09-03 69 views
2

我想創建一個自動語音識別系統,它將從數據庫中的單詞列表中識別出正確的單詞。我見過CMUSphinx可以用於這個問題。我已經嘗試了世界獅身人面像演示應用程序,但它沒有給出預期的結果。對單個單詞的語音朗讀

我不知道如何選擇正確的聲學模型,字典文件,語言模型。對於一個單詞是必要的語言模型?

印度英語是否有預建的聲學模型?

回答

2

我已經嘗試了世界獅身人面像演示程序hello hello,但它沒有給出預期的結果。

您需要提供更多關於您的嘗試的細節。關鍵詞識別是通過pocketsphinx支持,您可以在這裏

http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx

檢查要測試關鍵字察覺你可以試試:

pocketsphinx_continuous -infile file.wav -keyphrase "hello world" -kws_threshold 1e-40 

,將查找在文件中的關鍵詞。

I don't know how to choose the correct acoustic model, dictionary file, language model. For a single word is the language model necessary? 

語言模型是沒有必要的。對於聲學模型和字典,您可以選擇最適合您的語言的語言。

印度英語是否有預建的聲學模型?

有沒有印度英語的模型,但你可以嘗試美國英語模式,它應該適用於一個單詞。