voice-recognition

    0熱度

    1回答

    基本上,我希望我的應用能夠語音激活 如果用戶要求我的應用打開,那麼應該打開 如果用戶說了必須是輸入文本框 如果用戶說要點擊一個按鈕,必須完成 如果用戶想要讀取語音,那麼它應該讀出它。 基本上,我想有時候如果可能讀取用戶命令的應用程序,併爲我的用戶羣最好 沒有太多的可用文檔有,,,所以我想提出的問題在這裏

    1熱度

    1回答

    我想對大量的正在不斷地產生.wav文件進行語音識別。 有越來越多的在線語音到文本API服務(例如Google Cloud Speech,Amazon Lex,Twilio Speech Recognition,Nexmo Voice等),這將用於連接的應用程序工作得很好,但不適合這種用途的情況下,由於成本和帶寬。 快速谷歌搜索建議CMUSphinx(CMU =卡內基梅隆大學)是流行的語音識別。 我

    0熱度

    1回答

    作爲一名C++開發人員,想知道是否有可能開發語音用戶界面和語音識別軟件,如亞馬遜alexa,但使用c#語音庫通過語音命令打開特定軟件? 有人可以給我一些見解或讓我覺得?我使用C#中的Speech.Recognition,編寫了一個示例代碼,其中可以接受我的輸入,但問題在於它完全理解我的輸入。 繼續在這方面工作是一個好主意嗎?我感覺完全失去了。任何投入都將被批准。

    1熱度

    1回答

    我是新來的自然語言處理。我正在考慮將語音助手嵌入到可幫助執行任務(登錄,運行報告等)的軟件中。 該軟件已經使用AWS,我在想如果亞馬遜Lex(或任何其他服務/工具)具有我正在尋找的功能。 是否有任何準備使用的平臺可以測試?

    -4熱度

    1回答

    我正在爲亞馬遜Alexa(Echo)開發金融應用技能,但她對識別股票名稱不夠好。我需要大約15k股票的最大庫存量,顯然,她很難區分15k個非英文字典字符串的名稱。 爲了解決這個問題,我需要一個定製的堆棧: 自定義語法使用巴科斯範式或同級(提高我的設備的非英語詞典串的理解) 動態插槽類型(例如定義。如果我們知道用戶正在尋找他們自己的投資組合中的股票,選項可以從15k減少到〜50) 這些都不是由亞馬遜

    0熱度

    3回答

    我正在試圖在Android上使用SpeechRecognizer而沒有目標對話框。它可以在大多數設備上正常工作,但某些設備會返回音頻錄製錯誤(錯誤代碼3),並且此錯誤沒有詳細信息。有沒有解決辦法或原因? 謝謝!

    0熱度

    1回答

    Android設備支持語音識別,但是我想爲不支持Google服務的Epson Glass構建Ar應用程序,因此Google API的語音識別器無法工作。 因爲有任何SdK或庫提供語音功能的文字功能。 我在互聯網上搜索了很多,但沒有解決方案已經解決了我的問題,有解決方案可用於脫機模式語音識別,同時使用谷歌服務,我想要設備的語音識別設施,不支持谷歌服務,這是主要問題。我已經應用了所有的解決方案,但沒有

    0熱度

    1回答

    Twilio會議中是否可以實時進行語音識別?我爲單次通話做了這件事,但我需要爲會議做這件事。感謝您的幫助

    1熱度

    1回答

    我正在使用AVAudioSession來偵聽語音輸入。它適用於有線耳機,但它不適用於連接的藍牙設備。以下是我使用的設置輸入藍牙話筒代碼 func setupSessionForRecording() { let audioSession = AVAudioSession.sharedInstance() do { try audioSession.setCatego

    0熱度

    1回答

    是否有將語音轉換爲文本的API。我發現其中很少像ArtyOm.js,Speech API等。但它們只與Chrome瀏覽器兼容。是否有任何適用於Safari和Chrome或僅適用於Safari的內容。 TIA