2017-10-19 99 views
0

我正在嘗試使用口袋裏的獅身人面像轉錄音頻文件。預期音頻採樣率與實際不符?

pocketsphinx_continuous -infile 116-288045-0005.flac.wav 

,但我得到的錯誤:

ERROR: "continuous.c", line 136: Input audio file has sample rate [44100], 
     but decoder expects [16000] 
FATAL: "continuous.c", line 165: Failed to process file '116-288045-0005.flac.wav' 
     due to format mismatch. 

這是我需要轉錄音頻文件中的一個:Download from GitHub

最終,我將批量錄製超過5小時的像音頻文件這些,目前他們都拋出同樣的錯誤。

這裏的同一個文件的一些統計數據,我想抄寫:

$ soxi 116-288045-0000.flac.wav 

Input File  : '116-288045-0000.flac.wav' 
Channels  : 1 
Sample Rate : 44100 
Precision  : 16-bit 
Duration  : 00:00:10.65 = 469665 samples = 798.75 CDDA sectors 
File Size  : 939k 
Bit Rate  : 706k 
Sample Encoding: 16-bit Signed Integer PCM 

有可能是其中的某些文件的配置的問題,我已經做了一些預處理與MP3音樂進行合併,從flac轉換爲wav等等。

現在最簡單的方式讓我的轉錄工作?

是否有可能無需重新採樣文件回落到16kHz的。原來flac文件的採樣率爲16kHz,但我不得不將它們與44.1kHz的mp3文件合併。因此,現在有一些高頻信息可能會丟失,如果重新採樣到16k。

回答

1

重新採樣的音頻16000樣本,然後再試一次。

您可以重新取樣這樣
sox file.wav -r 16000 file-16000.wav

+0

但是擺脫的信息。發生了什麼事''.flac'文件最初是16000Hz,但我不得不將它們與44.1kHz的mp3文件合併。因此,那裏面有一些高頻率的信息,如果重新採樣到16K – theonlygusti

+0

可能丟了,我該怎麼辦呢而不重新取樣到16kHz的? – theonlygusti

+0

另一種選擇可能是修改配置文件並更改解碼器的默認採樣率。配置中的選項名稱是'-samprate' – deimus