2011-10-08 128 views
3

詞有限的語音識別是否有語音識別的解決方案,它(連續)的網絡瀏覽器

  • 只有幾個單詞(2就夠了,10將是很酷。100是真棒。更多不需要)
  • 也在移動瀏覽器上運行(是否可以使用閃存(而不是java)爲此?)
  • 可以安裝在您自己的服務器上。最好使用PHP + MySQL(如果需要服務器端代碼)

我試過搜索,但我只找到了實際的轉錄服務(如Google語音搜索for Android)。

+0

可能重複http://stackoverflow.com/questions/2748134/speech-recognition-with- flash-or-silverlight) – Mat

+0

你試圖完成的結果是什麼? – afuzzyllama

+0

謝謝你。 我想控制MP3文件的音頻播放(播放/暫停)。 – markmarijnissen

回答

1

這樣的解決方案的一個例子是touchless-timer,其基於pocketsphinx.js(在尼古拉Shmyrev的交也提到)。回答您的要點:

  • 它支持約60個單詞的簡單鬧鐘語法(短語如「喚醒我在五分鐘內」);
  • 我已經設法在Chrome Beta 32.0.1700.99 Android 4.1.2(在三星Galaxy S2上)上運行它,它需要一個現代化的Javascript引擎,但不需要Flash;
  • 它不需要服務器,因爲語音識別是在Javascript下離線完成的,所有必需的文件都可以使用ApplicationCache進行緩存。

對於這個應用程序,語法寫在Grammatical Framework中,並自動轉換爲pocketsphinx.js所需的有限狀態模型和字典。對於簡單的「MP3播放/暫停」語法,您可以輕鬆直接編寫FSA。

在這個應用程序中的英語聲學模型不是很好,即他們可能會被背景中的MP3播放困惑。您可以通過培訓更好的模型來改善這一點。但是,更好的模型可能會更大(例如,JavaScript中> 20 MB),並且不再適合內存,或者只是使應用程序運行/加載非常緩慢。

截圖上移動運行該應用的:

Screenshot of Timer running on a smartphone

[語音識別與Flash或Silverlight(的
1

現在你甚至不需要服務器來運行語音識別,你只需要一個支持Web Audio API的瀏覽器(最近的Firefox和Chrome都支持它)。 CMUSphinx現在可以在您的瀏覽器的JavaScript中執行。

更多細節參見

https://github.com/syl22-00/pocketsphinx.js

http://cmusphinx.sourceforge.net/2013/06/voice-enable-your-website-with-cmusphinx/

+0

這在Xubuntu上不適用於Firefox或Chromium。在Chromium Flash中沒有響應點擊以允許許可。在Firefox中工作但沒有出現在自動或手動模式下。 –

+0

嘿,過去兩年裏很多東西都改變了。我已經更新了答案,請嘗試新的客戶端技術,它應該在沒有閃存的情況下工作。 –

+0

我不會說這個可用。我試了一下,幾乎第一次工作,但認識到錯誤的數字(以及緩慢),之後,即使刷新後,我也無法做到它。我不會刪除舊的解決方案:至少在Firefox中可能有效。 –