speech-recognition

    4熱度

    2回答

    我有一個音頻緩衝區,我想對它執行語音識別/轉錄。我在本地限制了CPU和RAM,所以我想在服務器上執行識別。 有沒有任何(網絡)服務,讓我這樣做? 我搜索迄今已導致無處...

    2熱度

    2回答

    我想實現一個系統,通過Mac OS x上的麥克風接收語音。我知道任意的語音識別幾乎是不可能的,不需要訓練系統,所以我願意將它限制爲10個簡單的句子。它必須高度準確地識別出這10個句子中的哪一個正在說出,生成文本並向遠程MySQL數據庫添加條目。 由於這些是我想要實現的系統的架構,任何人都可以給我一個關於實現這個系統的最佳方式的概述嗎?我正在尋找像開源庫這樣的想法來最小化編碼,因爲這只是一個演示的原

    1熱度

    2回答

    我正在嘗試安裝語音識別引擎服務器端。 (非商業的首選,因爲它只是一個試驗) 的想法是允許用戶說,從網站的東西那麼無論他/她說會顯示在屏幕上(如文本) 我已經閱讀許多可用軟件,包括Microsoft Speech,Sphinx,Julius等,但不知道哪一個軟件可以執行最好的安裝。 另外,通常我還需要在我的主機上擁有root權限才能執行此類操作?我現在正在使用常規的共享主機。 謝謝 三通

    1熱度

    2回答

    的代碼不那麼complecated創建一個簡單的聽寫墊.. private { Private declarations } SpSharedRecoContext1 : TSpSharedRecoContext; fMyGrammar : ISpeechRecoGrammar; procedure SpSharedRecoContext1Recognition(ASender: TObj

    0熱度

    2回答

    我正在開發一個Web用戶界面,以輸入一些不是非常複雜但需要實時加載的信息。我認爲應用程序可以利用語音識別來促進任務。 接口的核心是用Javascript和jQuery構建的,但可以輕鬆包含flash或silverlight組件。我相信這可能是... 我不需要識別用戶說的所有內容,但只需要一些預先錄製的命令。 此外,我不希望用戶點擊按鈕來指定開始和結束的口頭命令。它應該被活體檢測到。 有什麼這樣做嗎

    2熱度

    2回答

    我想創建一個簡單的程序,使用com.apple.speech.recognitionserver循環用戶語音輸入。我的代碼迄今如下: set user_response to "start" repeat while user_response is not equal to "Exit" tell application id "com.apple.speech.recognitionse

    0熱度

    1回答

    有點左邊的字段,但我試圖訓練一個語音識別程序,指導方針建議我試圖說清楚,但自然。然而,我注意到,當一個人自然地說話時,每個單詞往往會漂移到下一個單詞中,導致單詞之間的界限相當模糊。 一方面,以一種更加動聽的方式說話似乎會幫助計算機識別音素,但另一方面則會使其不太可能理解更自然的言語。 任何在該領域有知識的人誰可以建議哪種方法更有效? 感謝

    1熱度

    1回答

    我正在使用Windows 7英語,我想知道如何查看微軟語音語言並查看語音識別是否處於活動狀態。 我該如何使用python做到這一點? 解決了: x=_winreg.ConnectRegistry(None,_winreg.HKEY_CURRENT_USER) try: y= _winreg.OpenKey(x, r"Software\Microsoft\Speech\Preferenc

    4熱度

    3回答

    我使用eclipse for android,其中API級別爲8,我嘗試過project-> properties-> android->但在這裏它只顯示一個用於API級別8的複選框請指導我做什麼?

    0熱度

    2回答

    我有一個python腳本,可以從streetinsider.com中提取EPS信息。目前我正在使用完全低效的方法清理數據,如下所示。想知道是否有人可以展示如何更有效地做到這一點。 下面的示例非常非常縮小,還有更多的列和許多更多的行。 eps_table = DataFrame({'% Beat': '+1,405%', '% Week': '+123%'}, index=[0]) things