在下面的代碼中,我如何只保留高於第95個分位數的觀察值?如何根據分位數過濾數據集
data test;
input business_ID $ count;
datalines;
'busi1' 2
'busi1' 10
'busi1' 4
'busi2' 1
'busi3' 2
'busi3' 1
;
run;
proc sort data = test;
by descending count;
run;
我不知道如何幹淨地股票的四分位,然後用if條件重新使用它。
感謝
編輯:我能確定此代碼的位數:
proc means data=test noprint;
var count;
output out=quantile P75=/autoname;
run;
但我怎麼能與它在Test
數據集,這樣我可以選擇位數以上的每一個意見?
後你試過到目前爲止。您可以使用PROC MEANS,UNIVARIATE或RANK來查找百分位數。 – Reeza