2017-07-17 99 views
0

我計算給定soundfile的fft並獲得形狀的數組,例如(100,257)具有100行和257個頻率倉。我想用這個作爲輸入向量爲神經網絡,但之前我想與librosa LIB正常化如何正常化神經網絡的fft值

https://librosa.github.io/librosa/generated/librosa.util.normalize.html#librosa.util.normalize

所以應該我正常化過軸= 0或軸= 1? axis = 0規範化了在行上聚合的列,而axis = 1規範化了每一行,或者我應該規範化每一個獨立於行和列的值嗎?

回答

0

你如何規範fft的方式取決於你的應用程序和最終性能。沒有一個通用的標準化方案。

在我的一個應用程序中,我沒有正常化並輸入原始fft到神經網絡。一個常用的方法是取對數。該操作可以減小動態範圍。