2016-07-05 27 views
0

我有一個包含16個測量值的數據集。我有一個分類變量「類型」它是0或1.我想對我的分類器進行排列測試。分類變量可能排列的數量

我想創建新的標籤,其中有8 = 1,8 = 0

我使用

sample(type, 16, replace = FALSE) 

它工作正常。

但我在想,因爲有這麼幾個我可以遇到的問題,有更多的測試組合比實際組合。這是一個問題,因爲你會得到低估/高估你的p值,例如在只有1000個可能的情況下進行百萬個置換。

所以我的問題是:

如何計算向量的排列的可能數目那裏是N患者必須有其他的一個的P和(N-P)。其次,出於好奇心,你會選擇什麼樣的數量進行完整的測試,而不是隨機抽樣。

我知道這很可能很簡單,我只是無法弄清楚。

回答

1

這樣combinations數爲Choose K from N

C(N,K) = N!/(K!*(N-K)!) 

對於你的情況C(16,8)=12870


可以使用R指令:

choose(N, K) 

例如:

choose(16,8) 
# [1] 12870