speech-to-text

    0熱度

    1回答

    在很多語音識別論文中,我看到這個術語「幀的上下文窗口」。我不確定這一點,但看起來好像你從一個話語中取出一個幀x,並且將這個幀連接到5個先前幀和5個未來幀。這個上下文窗口的標籤是中心框架。我對嗎? 謝謝 (順便說一下5號只是一個例子)

    3熱度

    2回答

    有沒有人曾試圖用兩個或更多的語音向文本API轉錄音頻?你可以使用時間戳來匹配單詞,並以最高的可信度選擇單詞。如果有人這樣做,是否顯着提高了轉錄的準確性?這值得麼?

    -1熱度

    1回答

    我需要建立一個程序,它可以在通話記錄列表中找到關鍵字。我怎樣才能做到這一點?如果有任何開源選項,請告訴我。 在此先感謝。

    0熱度

    2回答

    我使用在線教程製作了聊天機器人,現在除了在編輯文本中編寫輸入外,我還使用語音識別。但問題是當我按下語音識別按鈕時,tts不工作。我不知道我使用各種方法的問題是什麼。從編輯文本字段發送文本時,tts可以正常工作。這裏是主要活動中兩個代碼的示例。第一個代碼是通過發送按鈕發送文本,工作正常。第二個代碼是我使用stt聊天並且不工作的wone。需要幫助解決問題。提前致謝。 public class Main

    2熱度

    1回答

    我想禁用Google語音彈出窗口。我想讓它在後臺運行,所以不會出現彈出窗口。我在Visual Studio中用c#編程,我想在Android上/在Android上創建語音識別應用程序。 I downloaded the sample code from the Xamarin page 代碼: protected override void OnCreate(Bundle bundle) {

    0熱度

    1回答

    我正在嘗試使用語音識別模塊將語音轉換爲文本。 我的代碼開頭: import speech_recognition as sr r = sr.Recognizer() m = sr.Microphone() with m as source: print("Say Something...") audio = r.listen(source) 然而,這提供了以下錯誤:

    0熱度

    1回答

    使用java創建離線語音識別有沒有可能?它會打印所有單詞。現在我正在做這個任務,我不知道如何開始?請幫幫我!

    1熱度

    2回答

    使用WebSockets連接到STT。大部分工作良好。 當流式傳輸到Watson STT的半小時時,我發現平均時間爲 的時間爲1到2秒。我週期性地經歷更長時間的延遲。 8秒10秒。有時候,事情會得到真正的備份,延遲可能會高達60秒或更長!有沒有其他人經歷過這種行爲? 有沒有人有關於如何克服這個問題的建議? 謝謝!

    0熱度

    1回答

    我正在使用gTTS語音識別項目。問題是,當我運行代碼時,系統不響應它。 (它不會回答我的查詢)我嘗試按照我的知識,但無法解決它。如果有人能幫我解決這個問題,我將不勝感激。首先十分感謝。 這裏是我的代碼: import speech_recognition as sr from time import ctime import time import os import pyaudio f

    -1熱度

    1回答

    我想在C#窗口應用程序中創建一個Windows應用程序,應用程序應使用IBM Watson服務執行語音到文本轉換。 我們應該如何實現IBM Watson Speech to Text API服務 https://stream.watsonplatform.net/speech-to-text/api應該聽用戶的聲音並編寫輸出文本。 我搜索了很多文章,在所有這些例子中,.wav(音頻)文件作爲輸入傳