voice-recognition

0熱度

1回答

基本上，我希望我的應用能夠語音激活如果用戶要求我的應用打開，那麼應該打開如果用戶說了必須是輸入文本框如果用戶說要點擊一個按鈕，必須完成如果用戶想要讀取語音，那麼它應該讀出它。基本上，我想有時候如果可能讀取用戶命令的應用程序，併爲我的用戶羣最好沒有太多的可用文檔有,,,所以我想提出的問題在這裏

1熱度

1回答

的質量問題與離線語音到文本的使用Sphinx4

我想對大量的正在不斷地產生.wav文件進行語音識別。有越來越多的在線語音到文本API服務（例如Google Cloud Speech，Amazon Lex，Twilio Speech Recognition，Nexmo Voice等），這將用於連接的應用程序工作得很好，但不適合這種用途的情況下，由於成本和帶寬。快速谷歌搜索建議CMUSphinx（CMU =卡內基梅隆大學）是流行的語音識別。我

0熱度

1回答

使用C＃語音識別庫進行語音用戶界面或語音識別

作爲一名C++開發人員，想知道是否有可能開發語音用戶界面和語音識別軟件，如亞馬遜alexa，但使用c＃語音庫通過語音命令打開特定軟件？有人可以給我一些見解或讓我覺得？我使用C＃中的Speech.Recognition，編寫了一個示例代碼，其中可以接受我的輸入，但問題在於它完全理解我的輸入。繼續在這方面工作是一個好主意嗎？我感覺完全失去了。任何投入都將被批准。

1熱度

1回答

將語音助手構建爲軟件

我是新來的自然語言處理。我正在考慮將語音助手嵌入到可幫助執行任務（登錄，運行報告等）的軟件中。該軟件已經使用AWS，我在想如果亞馬遜Lex（或任何其他服務/工具）具有我正在尋找的功能。是否有任何準備使用的平臺可以測試？

-4熱度

1回答

亞馬遜Alexa不夠好。我的其他選擇是什麼？

我正在爲亞馬遜Alexa（Echo）開發金融應用技能，但她對識別股票名稱不夠好。我需要大約15k股票的最大庫存量，顯然，她很難區分15k個非英文字典字符串的名稱。爲了解決這個問題，我需要一個定製的堆棧：自定義語法使用巴科斯範式或同級（提高我的設備的非英語詞典串的理解）動態插槽類型（例如定義。如果我們知道用戶正在尋找他們自己的投資組合中的股票，選項可以從15k減少到〜50）這些都不是由亞馬遜

0熱度

3回答

Android SpeechRecognizer音頻錄製錯誤

我正在試圖在Android上使用SpeechRecognizer而沒有目標對話框。它可以在大多數設備上正常工作，但某些設備會返回音頻錄製錯誤（錯誤代碼3），並且此錯誤沒有詳細信息。有沒有解決辦法或原因？謝謝！

0熱度

1回答

沒有Google服務的語音識別對於Epson GLass AR App

Android設備支持語音識別，但是我想爲不支持Google服務的Epson Glass構建Ar應用程序，因此Google API的語音識別器無法工作。因爲有任何SdK或庫提供語音功能的文字功能。我在互聯網上搜索了很多，但沒有解決方案已經解決了我的問題，有解決方案可用於脫機模式語音識別，同時使用谷歌服務，我想要設備的語音識別設施，不支持谷歌服務，這是主要問題。我已經應用了所有的解決方案，但沒有

0熱度

1回答

Twilio會議中的文字實時發言

Twilio會議中是否可以實時進行語音識別？我爲單次通話做了這件事，但我需要爲會議做這件事。感謝您的幫助

1熱度

1回答

AVAudioSession不識別來自藍牙設備的音頻

我正在使用AVAudioSession來偵聽語音輸入。它適用於有線耳機，但它不適用於連接的藍牙設備。以下是我使用的設置輸入藍牙話筒代碼 func setupSessionForRecording() { let audioSession = AVAudioSession.sharedInstance() do { try audioSession.setCatego

0熱度

1回答

將語音轉換爲文本的JavaScript API

是否有將語音轉換爲文本的API。我發現其中很少像ArtyOm.js，Speech API等。但它們只與Chrome瀏覽器兼容。是否有任何適用於Safari和Chrome或僅適用於Safari的內容。 TIA