2014-01-09 41 views
0

我正在使用包apcluster對某些數據執行一些聚類。我現在有一個叫mat大型矩陣,其格式如下:R使用apcluster繪製日期

   date   A    B   C 
1  2000-01-03 2.00000000 0.300000000 4.00000000 
2  2000-01-04 0.20000000 0.000030000 -0.02469136 
3  2000-01-05 -0.07692308 -0.02469136 -0.07594937 

apcluster提供的功能來繪製集羣(如scatterboxes)覆蓋在你的原始數據。密謀當我做:

plot(cluster, mat) 

不需要擔心cluster,只有mat是給我的問題。上面給出了9個圖...對角線是列名(日期除外),每個圖表代表每列相對於另一列的數據。這意味着軸XY位於數據範圍內。對於A,它將從-0.082.0

所以我的問題是我如何繪製每列日期,日期將作爲X軸線作用,而從mat充當數據Y,使數據的所有三列將出現在一個情節,而不修改上面的plot命令?

apcluster文檔位於HERE

謝謝。

回答

1

我不是100%確定你需要什麼。你是否想將日期列包含在聚類過程和圖中?如果您在上面提到的數據框上運行apcluster(),則日期列將被忽略。所以,如果你想包括日期列,我的建議是將日期列轉換爲數字,例如,通過執行以下操作:

x$date <- as.numeric(as.Date(x$date)) 

的缺點是,其結果是在天(從1970-01-01),因此(1)中的列將在一個完全不同的規模比其它列和(2)地塊的軸線不會以非常可解釋的方式標記。因此,將日期轉換爲年份可能更好,例如,像2013-01-01 = 2013.00; 2013-07-01〜= 2013.50; 2014-01-01 = 2014.00。你懂我的意思嗎?

如果您選擇這兩個選項中的任何一個,則apcluster()將考慮日期,plot()命令也會針對日期列繪製列A,B ...。

乾杯, UBod

+0

感謝您的回覆。這基本上就是我實施的哈哈。 –

+0

偉大的思想思考相同;-) – UBod