7

我正在構建一個web應用程序並計劃使用speechRecognitionnavigator.getUserMedia作爲音頻輸入。語音識別和getUserMedia

我注意到我的桌面瀏覽器(Mac上的Chrome,v。31.0.1650.63)詢問兩次是否允許使用麥克風。雖然這可能對用戶有點煩人,但語音識別和音頻輸入似乎都有效。但是,如果我在Android(Nexus 7,Android v4.4.2; Chrome v31.0.1650.59)上打開相同的頁面,它會請求兩次允許使用我的麥克風,但我只能使用其中一個(以先發生者爲準)。有時,即使我授權訪問麥克風,我也會得到語音識別error: "not-allowed"錯誤。

我做了一個的jsfiddle,在這裏:http://jsfiddle.net/5xBpW/

我的問題是:有沒有對輸入數據流進行語音識別的方法嗎?或者有沒有其他方法可以使這兩種功能在Android版Chrome瀏覽器上都能正常運行?

+0

鑑於'getUserMedia'在Android上仍然相當實驗,'speechRecognition'全部都是實驗性的,這聽起來像是一個出色的錯誤報告。 [它似乎沒有被記錄](https://code.google.com/p/chromium/issues/list?q=getUserMedia+os%3DAndroid)。 – apsillers

+1

我爲此提出了一個新的錯誤:https://code.google.com/p/chromium/issues/detail?id=333881 – snorpey

回答

1

您是否考慮過其他工具? Nuance有一款令人興奮的新工具/產品(由現任Google工程部門主管Ray K創建),它使用專有學習算法(例如機器智能)將語音數據轉換爲動作。

這個工具理解語境,並且可以應用到具體行動,使用戶不必使用精確的短語:

https://developer.nuance.com/public/index.php?task=mix

遊:https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

的缺點是,你是依賴第三方,但是由於您正在查看的API也是實驗性的,因此可能會引起興趣。