2013-03-15 78 views
3

我試圖從使用MFCCs,他們的三角洲和德爾塔三角洲的語音構建基本的情感檢測器。許多論文都是通過對這些特徵進行GMM訓練來獲得較高的準確性。圖書館培訓來自MFCC的GMM

我似乎無法找到現成的軟件包來做同樣的事情。我確實在Python中使用Python,Voicebox和類似的工具包以及Rmixmod,stochmod,mclust,mixtools和R中的一些其他軟件包來玩弄。從經過訓練的數據中計算GMM的最佳庫是什麼?

+0

你是什麼意思最好?你已經指出了一些軟件包可以在R中進行高斯混合建模,在這裏還有其他一些軟件包http://cran.r-project.org/web/views/Cluster.html(並且請在下次使用縮寫詞時定義它們第一!!) – dickoa 2013-03-15 16:34:08

回答

2

具有挑戰性的問題是訓練數據,其中包含嵌入在功能集中的情緒信息。在測試信號中應該使用封裝情緒的相同特徵。使用GMM進行測試只會成爲您的通用背景模型。根據我的經驗,通常使用GMM,你只能分開男性女性和一些獨特的演講者。簡單地將MFCC饋入GMM是不夠的,因爲GMM不包含時變信息。由於情緒語言除了頻率變化MFCC參數之外還將包含時間變化的參數,例如音高和音高在週期上的變化。我並不是說目前的技術狀態是不可能的,但卻是一個很好的挑戰。