2016-08-18 104 views
2

我知道如何使用dplyr sample_n或sample_frac,它可以去像這樣採取隨機抽樣從數據幀的每個組,取一個樣品沒有dplyr組,R

dataset %>% 
    group_by(user_id) %>% 
    sample_n(10) 

不過,我有一個稍有不同的問題。我想從整個數據集中隨機抽取樣本。它應該是這一個簡單,

sample_n(dataset,10) 

但是,因爲我已經在前面的情況下使用的數據集GROUP_BY命令,似乎GROUP_BY仍需要在這裏效力。第二個命令相當於第一個。

我想知道如何去掉group_by的效果並從整個數據集中獲取隨機樣本?

回答

2

我們可以使用ungroup()刪除任何一組變量,然後應用sample_n

dataset %>% 
    group_by(user_id) %>% 
    ungroup() %>% 
    sample_n(10)