2012-02-17 53 views
1

我有一個集羣軟件,其中模式是字符串。 這些字符串按照使用最長公共子序列的相似性進行分組。 可以製作這個簇的二維圖?我怎樣才能在xy軸上表示一個字符串?表示2D圖中的字符串

我有唯一的想法是使用ascii碼以便具有從字符串的整數,例如: 紅色= 315 becouse R = 114 E = 101 d = 100

但這是1D代表!

p.s.該軟件是Java,但對於繪圖數據,我通常使用Matlab

回答

2

有無限多種方式將字符串轉換爲數字。基本上它只是一個字節序列,所以它們已經是數字了。

問題是,你想要什麼看到?這些「轉換」中的大多數將會遍佈整個地方,實際上並沒有傳達太多的意義。

我想到的兩種技術是自組織映射和多維縮放。您可以將相似性數據提供給該方法,並讓它將對象排列在二維地圖上。

這可能會工作,看起來很漂亮,但並沒有真正回答「你想達到什麼」的問題。

+0

如果可能的話,我希望看到2d圖中的點,例如: 表示單詞「歸納」的點可以靠近「入侵」這個詞。問題是如何在2D空間中表示「歸納」? – tulkas85 2012-02-19 11:54:17

+0

看看我給出的指針,比如MDS。它旨在保持距離,並且可以使用Levenshtein距離對其進行初始化。 – 2012-02-20 08:50:13