我想實現一個系統,通過Mac OS x上的麥克風接收語音。我知道任意的語音識別幾乎是不可能的,不需要訓練系統,所以我願意將它限制爲10個簡單的句子。它必須高度準確地識別出這10個句子中的哪一個正在說出,生成文本並向遠程MySQL數據庫添加條目。 由於這些是我想要實現的系統的架構,任何人都可以給我一個關於實現這個系統的最佳方式的概述嗎?我正在尋找像開源庫這樣的想法來最小化編碼,因爲這只是一個演示的原
我想創建一個簡單的程序,使用com.apple.speech.recognitionserver循環用戶語音輸入。我的代碼迄今如下: set user_response to "start"
repeat while user_response is not equal to "Exit"
tell application id "com.apple.speech.recognitionse