2016-12-06 56 views
0

我使用HTK來訓練聲學模型。我最後一步是分裂電話gaussians的混合物。通常,我總是將所有電話(它們的內部狀態)一步一步分開,然後在性能下降時重新評估並停止。HTK:通過電話優化混合分離手機

現在我想通過一個嘗試拆分手機之一,因爲這應導致同等或更好的整體效果。我這樣做的方式是,嘗試拆分每部手機,選擇能夠帶來最佳結果的手機,保持分離,重新設置所有其他手機,然後重新開始。這需要很長的時間。我想把所有那些帶來改進的不僅僅是最好的分開,然後進行下一次迭代。

我的問題是:如果拆分手機降低了性能,有沒有在後面的階段試圖再次分裂的任何一點?或者我可以將它列入黑名單,然後嘗試那些在最後一次迭代中帶來改進的項目?

回答

1

這種方案的改進通常很小。簡單地轉向DNN(順便支持HTK 3.5)可以獲得更好的改進。

如果拆分手機會降低性能,那麼在後期嘗試再次拆分手機是否有意義?或者我可以將它列入黑名單,然後嘗試那些在最後一次迭代中帶來改進的項目?

你可以黑名單

+0

謝謝!我不知道HTK 3.5運動神經網絡!你知道我需要多少訓練數據嗎?我有大約66個小時的訓練數據。它適用於總計1000小時左右的一位發言者的數據集。順便說一句,你不能黑名單。分裂'b'在第一次迭代中導致更差的性能,但是在第二次迭代中更好。 – Sixtease