2017-10-13 162 views
0

我的項目是使用麥克風進行說話人識別。Python上的麥克風的Wav文件

我正在使用speeh_recognition庫來提取我的麥克風音頻,但對象的類是'speech_recognition.AudioData',我不知道如何將其轉換爲wav文件(爲了使用librosa爲例然後獲取音頻功能,也許可以識別揚聲器)。

有人能幫我嗎?我一直在學習Python,所以可能還有更簡單的方法來使用麥克風進行揚聲器識別:) 非常感謝!

+0

到目前爲止您嘗試過什麼? – WhatsThePoint

回答

1

寫入音頻爲WAV文件:

with open("microphone-results.wav", "wb") as f: 
    f.write(audio.get_wav_data()) 

引述doc

返回表示含有由AudioData實例所表示的音頻WAV文件 的內容的字節串。

+0

非常感謝,它像夢一樣工作! – Maureen