分類變量可能排列的數量

我有一個包含16個測量值的數據集。我有一個分類變量「類型」它是0或1.我想對我的分類器進行排列測試。分類變量可能排列的數量

我想創建新的標籤，其中有8 = 1,8 = 0

我使用

sample(type, 16, replace = FALSE)

它工作正常。

但我在想，因爲有這麼幾個我可以遇到的問題，有更多的測試組合比實際組合。這是一個問題，因爲你會得到低估/高估你的p值，例如在只有1000個可能的情況下進行百萬個置換。

所以我的問題是：

如何計算向量的排列的可能數目那裏是N患者必須有其他的一個的P和（N-P）。其次，出於好奇心，你會選擇什麼樣的數量進行完整的測試，而不是隨機抽樣。

我知道這很可能很簡單，我只是無法弄清楚。

2016-07-05 anders

這樣combinations數爲Choose K from N

C(N,K) = N!/(K!*(N-K)!)

對於你的情況C(16,8)=12870

可以使用R指令：

choose(N, K)

例如：

choose(16,8) 
# [1] 12870

2016-07-05 13:03:24 MBo

回答