我必須將我的人口聚類在8 clusters
。我正在使用proc fastclus
和k-means
方法(以最小化羣集之間的差異)。觀察結果代表一個分數,所以即使在聚類過程之後,它們仍然是有序的。我注意到這樣:使用proc fastclus(SAS)維護意見訂購的K-means聚類
proc sort data=input.population;
by score;
run;
proc fastclus data = input.population
maxclusters = 8 list
out = score_clus
converge = 0.01 maxiter = 100
least = 2 noprint;
var score;
run;
程序沒有維護順序。有一種方法(可能是proc的一個參數),我可以使用另一種方法:最小化方差,但保持集羣內排序的分數。