2
我明白,要選擇一個隨機抽樣選擇隨機樣本,我可以用SAS從數據集
proc surveyselect data = raw_data method = srs n=200000 out=sample_data;
run;
但是,有時我raw_data有記錄< 200000如果raw_data小,我就數喜歡只保留raw_data;如果它超過一百萬條記錄,我想隨機選擇一條200k條記錄。我應該怎麼做?
謝謝!
RTM:你會發現選項全選 –
@data_null_我認爲OP希望[N <的1000000:nsamp =全部] [N>的1000000:NSAM = 200000],因此它比全選稍微複雜一些。 – Joe