2012-01-08 62 views
0

我想提取與聲音片段的某個區域相關的採樣字節數據,例如聲音片段中的一個單詞,以便獲得收集只與特定字有關的樣本數據,然後我可以通過FFT發送。我如何能夠從整個聲音文件的字節集合中識別出這些數據集合?由於它的16位聲音文件(44100Hz 15秒),文件中的一些字節數據在將它們轉換爲2字節值後看起來像這樣。檢測僅與聲音文件的某個部分相關的採樣數據

49150.0 
43010.0 
15622.0 
58886.0 
19460.0 
35583.0 
0.0 
7930.0 
507.0 
2303.0 
59897.0 
39419.0 
517.0 
6663.0 
9989.0 
13055.0 
9210.0 

我知道這個數據是在時域和我沒有看到任何數據變化顯著像0的識別沉默的集合。我能否在時域內做到這一點,或者我將不得不將這些數據帶入頻域,然後過濾不必要的數據並進行反向FFT以獲得有意義的數據集合。提前致謝。

回答

1

要做到這一點,最簡單的方法之一是將聲音文件加載到音頻編輯應用程序中,該應用程序可讓您設置選擇的開始點和結束點,只需聆聽並移動選擇點,直到聽到你要。試圖找到一個軟件算法可用的端點的準確和強大的描述是一個更加困難的問題。

+0

謝謝。但這是一個學術任務。是否甚至無法確定最有可能發聲的部分?我將只能提取少數樣本值。 – user1114638 2012-01-08 08:36:42