0
我有一個包含16個測量值的數據集。我有一個分類變量「類型」它是0或1.我想對我的分類器進行排列測試。分類變量可能排列的數量
我想創建新的標籤,其中有8 = 1,8 = 0
我使用
sample(type, 16, replace = FALSE)
它工作正常。
但我在想,因爲有這麼幾個我可以遇到的問題,有更多的測試組合比實際組合。這是一個問題,因爲你會得到低估/高估你的p值,例如在只有1000個可能的情況下進行百萬個置換。
所以我的問題是:
如何計算向量的排列的可能數目那裏是N患者必須有其他的一個的P和(N-P)。其次,出於好奇心,你會選擇什麼樣的數量進行完整的測試,而不是隨機抽樣。
我知道這很可能很簡單,我只是無法弄清楚。