我有一組數據,超過1000行和20個屬性(以列顯示)。 我想要使用均值居中,其中包括從每個值取平均值爲0.是否刪除屬性的基於屬性的平均值,還是刪除每個屬性的均值?統計平均居中 - 使用總均值或屬性平均值
例如,如果屬性A的平均值是500,屬性B的平均值是1000。 對於A I可以刪除500,其給出了A的所有屬性的值0的平均然後,我可以爲屬性做同樣B.
OR
我可以採取750關閉這兩個屬性的所有值。
哪個更具統計正確性?
我的問題是由於這個: 如果我從不同的屬性中減去不同的值,那麼這些屬性就不再可比,因爲每個屬性的取值都不同。如果我從所有數據中減去相同的數值,那麼某些列可能會充滿負數(因此否定平均中心的影響)。
感謝,
謝謝,這是一個神奇的解釋,它確實有幫助。 – ThePerson