2011-12-31 57 views
10

我試圖找出如何使用sphinx4或pocketsphinx與英文voxforge模型文本,但我不能讓它工作。我試圖閱讀文檔頁面(像這個http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html),但它不幫助我。如何使用CMU Sphinx的4語音與英語voxforge模式

我要的是一個可執行文件,我可以指定要使用的模型和音頻文件作爲源使用,並具有可執行文件打印出來它是什麼在錄音的聲音說最好的猜測。

我哈得有些運氣: pocketsphinx_continuous -infile爲recording.wav 2>的/ dev/null的

但它中止完整的音頻文件轉錄之前,默認的模型WAAY到幾句話,創建一個可讀來自音頻的文本。

我編寫和測試sphinx4源碼包的演示,但所有的例子似乎有幾句話,需要魔神的voxforge一個模型是對我有用。

我該如何設置?

+1

我已經能夠修改獅身人面像的位置轉錄使用Voxforge模型。壞消息是,即使在Voxforge,斯芬克斯的準確性也是令人尷尬的。我不會浪費你的時間與獅身人面像。這根本不可用。 – Cerin 2012-10-02 21:35:46

+0

@Cerin你會推薦什麼作爲替代方案? – 2012-11-05 22:01:15

+0

我也對替代品感興趣。你能給我們更好的嗎?優先免費? – Simon 2012-12-08 16:13:49

回答

10

這很簡單,在Voxforge聲學模型堵塞。涵蓋API的主要文件是cmusphinx教程:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

,然後再開始閱讀它它的建議。另請注意,建議使用En_US英文通用聲學模型,它比Voxforge更準確。

一步一步,你需要做到以下幾點:從SourceForge

  • 下載voxforge model並從github解壓縮到一個文件夾
  • 結帳sphinx4與gradle這個構建它
  • 運行TranscriberDemo
  • 轉到sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber文件夾,打開Transcriber演示並編輯聲學模型路徑,如下所示。
  • 編輯音頻文件的來源,如果你再
  • 運行演示需要另外的音頻文件,並享受

這將是它

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

非常好的答案...我也有類似的問題,我已經下載voxforge-ZH-0.3從SourceForge,等文件夾有這麼多的罐子,我只是不知道應該給哪條路徑... 請幫助並訪問http:// stackoverflow。com/questions/8727389/dictation-application-using-sphinx4 – aProgrammer 2012-01-11 12:34:22

+0

我不確定你在說什麼。在哪個罐子裏等?根本沒有罐子。至於那個問題,你沒有明確指出要解決的問題,不知道你在那裏有什麼問題。 – 2012-01-12 11:14:09

+0

我跟着你的回答,從sourceforge下載了VoxForge,但是我無法配置它與Sphinx4一起使用。你說'',然而這沒有爲我工作。所以我瀏覽了VoxForge文件夾,但嘗試過各種組合......但目前爲止沒有任何工作...... plz Help !!請參閱編輯答案.... – aProgrammer 2012-01-12 13:21:04

相關問題