0
我想提取與聲音片段的某個區域相關的採樣字節數據,例如聲音片段中的一個單詞,以便獲得收集只與特定字有關的樣本數據,然後我可以通過FFT發送。我如何能夠從整個聲音文件的字節集合中識別出這些數據集合?由於它的16位聲音文件(44100Hz 15秒),文件中的一些字節數據在將它們轉換爲2字節值後看起來像這樣。檢測僅與聲音文件的某個部分相關的採樣數據
49150.0
43010.0
15622.0
58886.0
19460.0
35583.0
0.0
7930.0
507.0
2303.0
59897.0
39419.0
517.0
6663.0
9989.0
13055.0
9210.0
我知道這個數據是在時域和我沒有看到任何數據變化顯著像0的識別沉默的集合。我能否在時域內做到這一點,或者我將不得不將這些數據帶入頻域,然後過濾不必要的數據並進行反向FFT以獲得有意義的數據集合。提前致謝。
謝謝。但這是一個學術任務。是否甚至無法確定最有可能發聲的部分?我將只能提取少數樣本值。 – user1114638 2012-01-08 08:36:42