2016-05-23 100 views
0

我試圖將IBM語音轉換爲文本API以將信使中的音頻轉錄爲文本腳本。使用w4a格式的音頻將IBM語音轉換爲文本(Node.js)

request({ 
     uri: attachment.url, 
     method: 'GET', 
     encoding: null 
     }, (err, res, audio) => {... do something...} 

我使用請求從我在消息中得到的url中獲取音頻文件。 但我只能得到W4A文件,沃森只支持

音頻/ FLAC

音頻/ WAV

音頻/ L16

音頻/ OGG

怎麼辦我將w4a格式的音頻轉換爲wav以符合規格。

或者還有其他方法可以做到這一點嗎?

謝謝。

+1

要查找的關鍵字是「nodejs」和「ffmpeg」。就像http://stackoverflow.com/questions/33725893/how-do-you-use-node-js-to-stream-an-mp4-file-with-ffmpeg –

+0

這實際上是一個沃森問題,所以我們需要添加watson標籤以獲得正確的關注 –

+0

這實際上是一個關於音頻轉換的問題,Watson STT服務支持的音頻格式在此處列出:https://www.ibm.com/watson/developercloud/doc/speech- to-text/input.html注意webm也被支持 –

回答

1

使用像audiobuffer-to-wav這樣的包將您的源音頻文件(.w4a)轉換爲Watson STT兼容格式(如mp3/wav),然後將轉換後的文件與Watson STT API一起使用。而且,如果您需要使用此庫服務器端,則可以使用web-audio-api包模擬AudioContext功能。