2
我知道如何使用dplyr sample_n或sample_frac,它可以去像這樣採取隨機抽樣從數據幀的每個組,取一個樣品沒有dplyr組,R
dataset %>%
group_by(user_id) %>%
sample_n(10)
不過,我有一個稍有不同的問題。我想從整個數據集中隨機抽取樣本。它應該是這一個簡單,
sample_n(dataset,10)
但是,因爲我已經在前面的情況下使用的數據集GROUP_BY命令,似乎GROUP_BY仍需要在這裏效力。第二個命令相當於第一個。
我想知道如何去掉group_by的效果並從整個數據集中獲取隨機樣本?