圖書館培訓來自MFCC的GMM

2013-03-15 78 views 3 likes

我試圖從使用MFCCs，他們的三角洲和德爾塔三角洲的語音構建基本的情感檢測器。許多論文都是通過對這些特徵進行GMM訓練來獲得較高的準確性。圖書館培訓來自MFCC的GMM

我似乎無法找到現成的軟件包來做同樣的事情。我確實在Python中使用Python，Voicebox和類似的工具包以及Rmixmod，stochmod，mclust，mixtools和R中的一些其他軟件包來玩弄。從經過訓練的數據中計算GMM的最佳庫是什麼？

來源

2013-03-15 Dony George

你是什麼意思最好？你已經指出了一些軟件包可以在R中進行高斯混合建模，在這裏還有其他一些軟件包http://cran.r-project.org/web/views/Cluster.html（並且請在下次使用縮寫詞時定義它們第一!!） – dickoa 2013-03-15 16:34:08

回答

具有挑戰性的問題是訓練數據，其中包含嵌入在功能集中的情緒信息。在測試信號中應該使用封裝情緒的相同特徵。使用GMM進行測試只會成爲您的通用背景模型。根據我的經驗，通常使用GMM，你只能分開男性女性和一些獨特的演講者。簡單地將MFCC饋入GMM是不夠的，因爲GMM不包含時變信息。由於情緒語言除了頻率變化MFCC參數之外還將包含時間變化的參數，例如音高和音高在週期上的變化。我並不是說目前的技術狀態是不可能的，但卻是一個很好的挑戰。

來源

2014-03-05 18:43:23 Lalin