voice-recognition

    -3熱度

    1回答

    我會直接指出這一點。 我有一個由點表示的3D圖形的情節,我想要做的是給matlab一個語音命令,使一個功能開始。 具體而言,我想說的例如「旋轉」,matlab應該識別這個聲音命令,並使圖中的實際圖形旋轉。 這是可能的或我應該放棄?因爲我會瘋狂嘗試。 在此先感謝。

    0熱度

    1回答

    使用java創建離線語音識別有沒有可能?它會打印所有單詞。現在我正在做這個任務,我不知道如何開始?請幫幫我!

    2熱度

    1回答

    如何通過使用LIUM揚聲器二值化工具箱知道哪個揚聲器講了多少時間? 例如,這是我的.seg文件。 ;; cluster S0 [ score:FS = -33.93166562542459 ] [ score:FT = -34.24966646974656 ] [ score:MS = -34.05223781565528 ] [ score:MT = -34.32834794609819 ]

    2熱度

    1回答

    可以將Microsoft Bing Speech API配置爲僅返回數字和字母,而不是全部單詞? 該用例正在翻譯加拿大郵政編碼。防爆。 M 1 B 0 R 3.微軟可能會返回「Em 1 Be 0 Are 3」 我們的音頻文件是8000hz,並用「M-ULAW」編碼。我們在改變採樣率或編碼方面沒有靈活性。我們正在使用「SMD」方案,但我無法找到有關此功能的任何文檔。基地請求URI: https://

    0熱度

    1回答

    我有識別來自Android操作系統的人的聲音和語音轉換成文本的應用程序的想法。我在前臺完成了這個過程。但是我需要在背景中實現它。 對於這一點,我想辦法。我的方法是獲取活動背景狀態,然後從那裏調用服務。在那之後,每當應用程序將在每次調用服務時都處於後臺。 我不知道如何實現這一點。 我的前景源代碼作爲 private void promptSpeechInput(){ //----ta

    0熱度

    1回答

    我正在使用S8/S8 +。我想從Intent調用bibxy應用程序。但是,我無法稱呼它。我如何從Intent調用它? 這是我嘗試 final String SVOICE_PACKAGE_NAME = "com.samsung.voiceserviceplatform"; final Intent intent = new Intent(); intent.setPackage(SVOICE_P

    1熱度

    1回答

    在試圖將語音轉換爲文本(IBM語音網關IVR應用程序)以識別字母數字字符串時,我想知道是否可以創建自定義語法或實體來限制STT以識別單個字母和數字,排除單詞共。例如,這是一個典型的字符串:20Y0H8C。沃森回來的話和數字,如「兩」而不是「2」。數字字符串正常工作。我意識到字母識別對於典型的ASR是有問題的,但我希望沃森能夠勝任這項任務。我注意到沒有用於字母數字字符的系統實體。任何建議,非常感謝。

    7熱度

    1回答

    我正在開發基於語音的AI的iOS應用;即它意味着從麥克風接收語音輸入,將其轉換爲文本,發送給AI代理,然後通過揚聲器輸出返回的文本。儘管使用一個按鈕來開始和停止錄製語音(SpeechKit用於語音識別,AI的API.AI,Amazon的Polly用於輸出),但我已經掌握了所有工作。 我需要的是讓麥克風始終打開,並在用戶開始和結束通話時自動開始和停止錄製用戶的聲音。這個應用程序正在開發非傳統環境,用

    -2熱度

    1回答

    工作:我想喜歡「當我打電話,它會啓動語音識別方法,並給出語音識別的結果 問題的應用:語音識別器,當我開始打電話該方法,但它不是給語音識別瞬間的結果它給在第二呼叫第一個呼召的結果 我的代碼:。 語音識別類: package com.ooo.voicerecog; import java.util.ArrayList; import android.Manifest; import androi

    0熱度

    1回答

    我目前在Swift中製作的應用程序將幫助盲人使用這一綜合解決方案導航世界。我正在尋找一個應用程序的通用函數,當被調用時,它將立即開始錄製,傾聽用戶說出的內容,一旦用戶停止說話,它將自動停止錄製,將錄製內容轉換爲字符串,然後返回它。該功能應該可以在單個視圖控制器中多次使用。 我一直在使用從這篇文章的技術嘗試,並沒有奏效:https://medium.com/ios-os-x-development/