語音識別將單詞拼音到音素水平

我正在考慮爲我的母語開發語音識別軟件，我正在考慮爲此使用CMUSphinx-4。有一個CMU字典文件，其中包含英文單詞，將原始單詞分割到其音素邊界。例如， ABANDONED => ['AH'，'B'，'AE'，'N'，'D'，'AH'，'N'，'D'] 我無法理解背後的邏輯，想要爲這個詞的對話開發一個算法。如果任何人都可以知道這種轉換的算法或這種分裂如何發生，請與我分享。語音識別將單詞拼音到音素水平

來源

2015-09-06 jan