詞有限的語音識別是否有語音識別的解決方案,它(連續)的網絡瀏覽器
- 只有幾個單詞(2就夠了,10將是很酷。100是真棒。更多不需要)
- 也在移動瀏覽器上運行(是否可以使用閃存(而不是java)爲此?)
- 可以安裝在您自己的服務器上。最好使用PHP + MySQL(如果需要服務器端代碼)
我試過搜索,但我只找到了實際的轉錄服務(如Google語音搜索for Android)。
詞有限的語音識別是否有語音識別的解決方案,它(連續)的網絡瀏覽器
我試過搜索,但我只找到了實際的轉錄服務(如Google語音搜索for Android)。
這樣的解決方案的一個例子是touchless-timer,其基於pocketsphinx.js(在尼古拉Shmyrev的交也提到)。回答您的要點:
對於這個應用程序,語法寫在Grammatical Framework中,並自動轉換爲pocketsphinx.js所需的有限狀態模型和字典。對於簡單的「MP3播放/暫停」語法,您可以輕鬆直接編寫FSA。
在這個應用程序中的英語聲學模型不是很好,即他們可能會被背景中的MP3播放困惑。您可以通過培訓更好的模型來改善這一點。但是,更好的模型可能會更大(例如,JavaScript中> 20 MB),並且不再適合內存,或者只是使應用程序運行/加載非常緩慢。
截圖上移動運行該應用的:
[語音識別與Flash或Silverlight(的現在你甚至不需要服務器來運行語音識別,你只需要一個支持Web Audio API的瀏覽器(最近的Firefox和Chrome都支持它)。 CMUSphinx現在可以在您的瀏覽器的JavaScript中執行。
更多細節參見
https://github.com/syl22-00/pocketsphinx.js
http://cmusphinx.sourceforge.net/2013/06/voice-enable-your-website-with-cmusphinx/
這在Xubuntu上不適用於Firefox或Chromium。在Chromium Flash中沒有響應點擊以允許許可。在Firefox中工作但沒有出現在自動或手動模式下。 –
嘿,過去兩年裏很多東西都改變了。我已經更新了答案,請嘗試新的客戶端技術,它應該在沒有閃存的情況下工作。 –
我不會說這個可用。我試了一下,幾乎第一次工作,但認識到錯誤的數字(以及緩慢),之後,即使刷新後,我也無法做到它。我不會刪除舊的解決方案:至少在Firefox中可能有效。 –
可能重複http://stackoverflow.com/questions/2748134/speech-recognition-with- flash-or-silverlight) – Mat
你試圖完成的結果是什麼? – afuzzyllama
謝謝你。 我想控制MP3文件的音頻播放(播放/暫停)。 – markmarijnissen