-1
X和Y是不相關的(0.3);然而,當我把X在隨機森林分類預測Y,旁邊兩(A,B)其他(相關)變量,X和兩個其他變量(A,B)爲Y.注意的顯著預測的是,其他兩個(A, B)變量也無法與Y. 相關怎樣才能根據統計和機器學習的想法解釋這一點。X和Y不相關,但Y是Xin隨機森林分類器的預測。如何使用統計和機器學習來表示這一點?
代表一個或多個可變(A或B或Y)相對於另一變量(X),其中變量不具有很強的相關性。
X和Y是不相關的(0.3);然而,當我把X在隨機森林分類預測Y,旁邊兩(A,B)其他(相關)變量,X和兩個其他變量(A,B)爲Y.注意的顯著預測的是,其他兩個(A, B)變量也無法與Y. 相關怎樣才能根據統計和機器學習的想法解釋這一點。X和Y不相關,但Y是Xin隨機森林分類器的預測。如何使用統計和機器學習來表示這一點?
代表一個或多個可變(A或B或Y)相對於另一變量(X),其中變量不具有很強的相關性。
相關性是線性的。如果存在非線性關係,則可能看不到相關性。
隨機森林(決策樹是非線性的),所以你能預測發現一個隨機森林,即使相關性爲零。
A quadratic function could have zero correlation between X and Y
對相關該圖像,更可以在 https://www.statisticalengineering.com/correlation.htm
發現這可能是https://stats.stackexchange.com/一個更好的問題 – Pace