0
當從WEKA調用分層聚類(我使用C#中的IKVM,但我不認爲它很重要,答案可以用任一種語言)時,有一個選項可以生成Newick格式的樹形圖,但是當試圖解析它時,我需要識別葉子並將每個葉子的假連接到輸入中的一個數據(矢量)。WEKA分層聚類輸出 - 葉識別模糊
例如,輸入ARFF是:
@RELATION points
@ATTRIBUTE x REAL
@ATTRIBUTE y REAL
@DATA
1.0,2.0
3.0,1.0
1.0,3.0
2.0,1.0
我會得到在Newick格式如下樹狀圖:
((2.0:1,3.0:1):1.49661,(1.0:1,1.0:1):1.49661)
在哪裏並不清楚點是如何確定的(第一個分支有2和3,但第二個分支有1和1,但不清楚哪一個是哪個)。
有沒有辦法改變這個輸出的表現方式,或者在Newick輸出中以更好的方式添加額外的唯一屬性標識基準點?
我覺得我誤解了輸出,請讓我知道如果我是,也許輸出不代表每個點,但代表具體的y –