-1

我很好奇「框架阻塞」,這是我在網站上看到的特徵提取的第一步。它說,這些步驟應遵循的音頻特徵提取:「幀阻塞」是什麼意思?

  1. 幀中的塊
  2. 窗口
  3. FFT
  4. 梅爾頻率翹曲

是什麼「幀封鎖」是什麼意思?任何人都可以給出一個算法或代碼(C#)?

順便說一句,這是特徵提取的步驟順序嗎?

我應該如何在特徵提取之前對aduio進行「預過濾」?

謝謝。

+0

你有沒有發現哪個網站上這個詞? – 2013-03-23 22:27:24

回答

2

這是我從谷歌搜索找到的術語「幀阻塞」 - 谷歌自動完成到「幀語音信號的幀阻塞」。

http://books.google.com/books?id=B9VuCBBYzJ4C&pg=PA21&lpg=PA21&dq=frame+blocking+of+speech+signal&source=bl&ots=FCzp86g8F0&sig=P5aolL4OAAyPwxZ2nMd-Ye_5M_I&hl=en&sa=X&ei=oLM3UeK3DsTfrQHyvYD4DQ&sqi=2&ved=0CC4Q6AEwAA#v=onepage&q=frame%20blocking%20of%20speech%20signal&f=false

相關的文字:

中speach信號處理最普通的方法是基於短時間分析。預佔信號被阻斷成N樣本的幀。幀持續時間通常介於10 - 30 mxec之間。此範圍內的值表示頻譜變化率與系統複雜度之間的折衷。適當的幀持續時間最終取決於語音製作系統中咬合器的速度。一些聲音(例如,停止輔音)表現出尖銳的頻譜轉換,這可能導致頻譜峯移動高達80Hz/msec(Mar76)。圖2.3說明了將一個單詞阻擋到幀的重疊量,一定程度上控制如何快速參數可以從幀改變。

我們您的問題是,你有什麼話就試圖幀中的塊?