2015-09-06 173 views
1

我正在考慮爲我的母語開發語音識別軟件,我正在考慮爲此使用CMUSphinx-4。有一個CMU字典文件,其中包含英文單詞,將原始單詞分割到其音素邊界。例如, ABANDONED => ['AH','B','AE','N','D','AH','N','D'] 我無法理解背後的邏輯,想要爲這個詞的對話開發一個算法。如果任何人都可以知道這種轉換的算法或這種分裂如何發生,請與我分享。語音識別將單詞拼音到音素水平

回答

1

原詞的音素邊界

「邊界」 是一個錯誤的詞在這裏。它將單詞映射到音素序列,沒有任何關於邊界的內容

如果任何人都可以知道此轉換的算法或這種分割如何發生,請與我分享。

字典建設是覆蓋在我們的教程

http://cmusphinx.sourceforge.net/wiki/tutorialdict