2015-02-24 109 views
1

我有一個包含重複的獨特患者ID(〜250,000)的數據集。我想統計每個唯一RID出現的平均次數。我只能找出如何使用計算的實際次數每一個獨特的RID出現:計算重複變量的平均數

proc freq data=patients; 
tables rid; 
run; 

IE:我不想知道
RID 1出現2
RID 2出現4
RID 3出現3

我想知道的是,平均數是唯一的RID出現爲3

感謝您的幫助!

回答

0

您可以通過PROC SQL實現這一

Select count(*)/count(distinct rid) 
from patients; 
1

數學表示記錄總數除以唯一RID數量。

您可以將SQL與COUNT DISTINCT和COUNT一起使用來完成此操作。