2011-09-08 74 views
2

如果我們使用語音識別的集成Windows 7功能,我們可以看到,它非常適合猜測我們所指定的內容。它不僅適用於一套有限的命令,而且適用於任何口頭的單詞。另一方面,當我嘗試針對Microsoft.Speech命名空間(Microsoft Speech Server Runtime 10.2是我安裝的)中的類進行編程時,我發現自己需要始終定義要使用的有限語法。Microsoft.Speech通用語言語法

有沒有一種方法來獲取口述音頻文件,並嘗試將其解析爲文本,而無需在Microsoft.Speech中指定自定義語法?

回答

4

我的理解是,桌面操作系統帶有聽寫語法。但是,服務器識別器不包括聽寫語法,因爲它們主要用於電話使用,其中用戶向IVR系統提供短命令。對於一些更多的背景下,這個問題可能會有所幫助 - What is the best option for transcribing speech-to-text in a asp.net web app?

記住桌面識別器在同一時間使用一個用戶。他們可以接受培訓以提高每個用戶的認知度。服務器識別器旨在同時處理多個用戶。服務器識別器不能被訓練。也許,沒有訓練,準確的聽寫語法太難了? (或者,也許微軟並不希望放棄所有的最好的技術?)

我也看到了(但還沒有檢查)的桌面識別支持更高質量的音頻(更高的比特率和採樣大小)和服務器識別器僅限於電話質量音頻。也許準確的轉錄需要更高質量的音頻。

+0

你可能是對的。仍然爲什麼不爲服務器識別器製作聽寫語法,使其更具功能性。 –

+0

引用問題中的一個例子非常好。謝謝。 –