speech-recognition

4熱度

2回答

我有一個音頻緩衝區，我想對它執行語音識別/轉錄。我在本地限制了CPU和RAM，所以我想在服務器上執行識別。有沒有任何（網絡）服務，讓我這樣做？我搜索迄今已導致無處...

2熱度

2回答

我想實現一個系統，通過Mac OS x上的麥克風接收語音。我知道任意的語音識別幾乎是不可能的，不需要訓練系統，所以我願意將它限制爲10個簡單的句子。它必須高度準確地識別出這10個句子中的哪一個正在說出，生成文本並向遠程MySQL數據庫添加條目。由於這些是我想要實現的系統的架構，任何人都可以給我一個關於實現這個系統的最佳方式的概述嗎？我正在尋找像開源庫這樣的想法來最小化編碼，因爲這只是一個演示的原

1熱度

2回答

服務器端語音文本

我正在嘗試安裝語音識別引擎服務器端。（非商業的首選，因爲它只是一個試驗）的想法是允許用戶說，從網站的東西那麼無論他/她說會顯示在屏幕上（如文本）我已經閱讀許多可用軟件，包括Microsoft Speech，Sphinx，Julius等，但不知道哪一個軟件可以執行最好的安裝。另外，通常我還需要在我的主機上擁有root權限才能執行此類操作？我現在正在使用常規的共享主機。謝謝三通

1熱度

2回答

如何Delphi2009 + Vista中

的代碼不那麼complecated創建一個簡單的聽寫墊.. private { Private declarations } SpSharedRecoContext1 : TSpSharedRecoContext; fMyGrammar : ISpeechRecoGrammar; procedure SpSharedRecoContext1Recognition(ASender: TObj

0熱度

2回答

使用Flash或Silverlight進行語音識別

我正在開發一個Web用戶界面，以輸入一些不是非常複雜但需要實時加載的信息。我認爲應用程序可以利用語音識別來促進任務。接口的核心是用Javascript和jQuery構建的，但可以輕鬆包含flash或silverlight組件。我相信這可能是... 我不需要識別用戶說的所有內容，但只需要一些預先錄製的命令。此外，我不希望用戶點擊按鈕來指定開始和結束的口頭命令。它應該被活體檢測到。有什麼這樣做嗎

2熱度

2回答

語音識別服務器不保持打開

我想創建一個簡單的程序，使用com.apple.speech.recognitionserver循環用戶語音輸入。我的代碼迄今如下： set user_response to "start" repeat while user_response is not equal to "Exit" tell application id "com.apple.speech.recognitionse

0熱度

1回答

培訓語音識別軟件

有點左邊的字段，但我試圖訓練一個語音識別程序，指導方針建議我試圖說清楚，但自然。然而，我注意到，當一個人自然地說話時，每個單詞往往會漂移到下一個單詞中，導致單詞之間的界限相當模糊。一方面，以一種更加動聽的方式說話似乎會幫助計算機識別音素，但另一方面則會使其不太可能理解更自然的言語。任何在該領域有知識的人誰可以建議哪種方法更有效？感謝

1熱度

1回答

如何查看Microsoft語音識別語言，以及它是否使用Python活動？

我正在使用Windows 7英語，我想知道如何查看微軟語音語言並查看語音識別是否處於活動狀態。我該如何使用python做到這一點？解決了： x=_winreg.ConnectRegistry(None,_winreg.HKEY_CURRENT_USER) try: y= _winreg.OpenKey(x, r"Software\Microsoft\Speech\Preferenc

4熱度

3回答

如何在Eclipse中將API級別8更改爲3

我使用eclipse for android，其中API級別爲8，我嘗試過project-> properties-> android->但在這裏它只顯示一個用於API級別8的複選框請指導我做什麼？

0熱度

2回答

在熊貓中更有效地清理數據

我有一個python腳本，可以從streetinsider.com中提取EPS信息。目前我正在使用完全低效的方法清理數據，如下所示。想知道是否有人可以展示如何更有效地做到這一點。下面的示例非常非常縮小，還有更多的列和許多更多的行。 eps_table = DataFrame({'% Beat': '+1,405%', '% Week': '+123%'}, index=[0]) things