對單個單詞的語音朗讀

我想創建一個自動語音識別系統，它將從數據庫中的單詞列表中識別出正確的單詞。我見過CMUSphinx可以用於這個問題。我已經嘗試了世界獅身人面像演示應用程序，但它沒有給出預期的結果。對單個單詞的語音朗讀

我不知道如何選擇正確的聲學模型，字典文件，語言模型。對於一個單詞是必要的語言模型？

印度英語是否有預建的聲學模型？

我已經嘗試了世界獅身人面像演示程序hello hello，但它沒有給出預期的結果。

您需要提供更多關於您的嘗試的細節。關鍵詞識別是通過pocketsphinx支持，您可以在這裏

檢查要測試關鍵字察覺你可以試試：

pocketsphinx_continuous -infile file.wav -keyphrase "hello world" -kws_threshold 1e-40

，將查找在文件中的關鍵詞。

I don't know how to choose the correct acoustic model, dictionary file, language model. For a single word is the language model necessary?

語言模型是沒有必要的。對於聲學模型和字典，您可以選擇最適合您的語言的語言。

印度英語是否有預建的聲學模型？

有沒有印度英語的模型，但你可以嘗試美國英語模式，它應該適用於一個單詞。

2014-09-03 08:19:25

回答