2009-10-04 94 views
2

我已經在我的Windows XP系統和JSAPI上安裝了Sphinx-4。我想將英語口語WAV(或MP3)文件轉錄爲文本。獲取WAV文件轉錄與Sphinx4一起使用

當我運行"WavFile" demo - 它運行成功。

java -jar WavFile.jar 

但是,當我通過我自己的wav文件是這樣的:

java -jar WavFile.jar c:\test.wav 

我得到:

加載識別器在「罐子定義:文件:/ C:/ sphinx4 -1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml'...

解碼jar:file:/ C:/ sphinx4- 1.0beta3斌/ sphinx4-1.0beta3 /斌/ WavFil !e.jar /edu/cmu/sphinx/demo/wavfile/12345.wav 結果:一二三四五

看來這是演示設置加載和運行的內部wav文件(「12345。 WAV「)或其他東西。

我已經閱讀了文檔,但無法確定如何設置「config.xml」,甚至是將其放置在什麼目錄中。我只是試圖獲得使用標準運行的概念的簡單證明演示。

所以,問題是:如何運行一個Sphinx4程序來轉錄一個wav文件?

謝謝。

回答

6

只需要什麼是編寫使用CMU詞典(美國英語),而不是一個新的應用程序(基於Transcriber.java) Transcriber.jar支持的數字。

獅身人面像沒有提供這樣有用的樣本是很奇怪的。

0

看看pocketsphinx軟件包。它用C語言編寫,已經針對每個平臺編譯,可以用作命令行或作爲應用程序的一部分。我一直在使用它的命令行,它非常全面。

1

我知道這是一個超級老的線程,但我只想指出,您的示例似乎已經完美運行。如果你看看你的輸出的最後:

解碼jar:file:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/ edu/cmu/sphinx/demo /wavfile/12345.wav結果:一二三四五< ==========解碼WAV AUDIO的結果!