使用w4a格式的音頻將IBM語音轉換爲文本（Node.js）

我試圖將IBM語音轉換爲文本API以將信使中的音頻轉錄爲文本腳本。使用w4a格式的音頻將IBM語音轉換爲文本（Node.js）

request({ 
     uri: attachment.url, 
     method: 'GET', 
     encoding: null 
     }, (err, res, audio) => {... do something...}

我使用請求從我在消息中得到的url中獲取音頻文件。但我只能得到W4A文件，沃森只支持

音頻/ FLAC

音頻/ WAV

音頻/ L16

音頻/ OGG

怎麼辦我將w4a格式的音頻轉換爲wav以符合規格。

或者還有其他方法可以做到這一點嗎？

謝謝。

要查找的關鍵字是「nodejs」和「ffmpeg」。就像http://stackoverflow.com/questions/33725893/how-do-you-use-node-js-to-stream-an-mp4-file-with-ffmpeg –

這實際上是一個沃森問題，所以我們需要添加watson標籤以獲得正確的關注 –

這實際上是一個關於音頻轉換的問題，Watson STT服務支持的音頻格式在此處列出：https：//www.ibm.com/watson/developercloud/doc/speech- to-text/input.html注意webm也被支持 –

使用像audiobuffer-to-wav這樣的包將您的源音頻文件（.w4a）轉換爲Watson STT兼容格式（如mp3/wav），然後將轉換後的文件與Watson STT API一起使用。而且，如果您需要使用此庫服務器端，則可以使用web-audio-api包模擬AudioContext功能。

2017-12-14 20:46:47 Varun

回答