我正在使用一些音頻指紋識別技術來標記長時間錄音中的歌曲。例如,在電臺節目中。指紋識別機制工作正常,但我有正常化(或降採樣)的問題。音頻正常化/固定?
alt text http://i26.tinypic.com/2v0j1c3.jpg
在這裏你可以看到兩個相同的歌曲,但不同的波形。我知道我應該做一些直流偏移固定,並使用一些高和低增益濾波器。我已經用Sox使用高通1015和低通1015做了他們。我使用wavegain來修復音量和直流偏移。但在這種情況下,波形變成一個象下面這樣:
alt text http://i27.tinypic.com/dpk9dy.jpg
但即使在這種情況下,我不能得到相同的指紋。 (我不期望%100相同,但至少%50會很好)
所以。你怎麼看?我能做些什麼來修復記錄以獲得相同的指紋?也許一些音頻過濾將工作,但我不知道哪一個使用?你可以幫我嗎?
順便說一句,這裏是指紋技術的解釋。
http://wiki.musicbrainz.org/Future_Proof_Fingerprint
http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function
這是一個真正的編程問題嗎? – Amber 2009-08-05 06:36:19