可以將Microsoft Bing Speech API配置爲僅返回數字和字母,而不是全部單詞? 該用例正在翻譯加拿大郵政編碼。防爆。 M 1 B 0 R 3.微軟可能會返回「Em 1 Be 0 Are 3」 我們的音頻文件是8000hz,並用「M-ULAW」編碼。我們在改變採樣率或編碼方面沒有靈活性。我們正在使用「SMD」方案,但我無法找到有關此功能的任何文檔。基地請求URI: https://
我正在使用Text to Speech API的Azure代碼示例(https://github.com/Azure-Samples/Cognitive-Speech-TTS/tree/master/Samples-Http/PHP),它返回音頻,但我不明白如何捕獲流在瀏覽器中播放? 我試圖建立文本到語音演示這裏https://azure.microsoft.com/en-us/services/