6

我正在移動設備上實施標籤雲。數據模型等的細節在這裏並不特別重要。我的問題是關於標籤的縮放比例:關於縮放標籤雲中的標籤

將標籤頻率映射到字體大小的「最佳」表達式是什麼?

我看過this post討論線性和對數比例尺和this answer來自阿德里安庫恩草圖的多項式方法的靈感。然而,我似乎記得在這個問題上有更多的探索,在互聯網上發佈了一些帖子。

我在博客上也發現了一些「best practices」,但我不確定最佳實踐的意義。這些對頻率縮放沒有評論。

對於標記縮放還有哪些選擇,哪些是首選/標準方法?我也在考慮最小的字體大小,最大數量的標籤,顏色等。

編輯:根據this question的討論,我對「標準」tagcloud感興趣,字體大小有所不同。

+0

呃,退房本網站的右欄 - 按降序排列的實例數排序,右邊的數字排序。適用於我。 – Benjol 2009-08-25 11:20:21

回答

3

我去年一個小標籤雲項目,其中我沿着

β=(INT)(((maxθ - minθ)×ω)+minθ+ 0.5)的線使用的東西的工作
其中ω是根據某個度量(以您的字體頻率)計算的加權,minθ和maxθ是下限和上限,β是最終值。這可以應用於任何視覺特徵(字體大小,顏色,重量,如果支持等)。

我發現線性和對數縮放傾向於依賴於數據集分佈。在突出異常值的數據集中,我發現tanh對於「平滑」結果值很有用。

+0

這是我最終選擇的線性縮放比例。好主意re:tanh,我會再看看。 – jamesh 2010-10-28 14:00:40

2

this pdf中有一個很好的討論,它討論了要顯示的標籤上的縮放,聚類和截斷。

0

溶液我發現作品很好地是如下

font_size = (max_font_size - min_font_size) * (Math.sin(1.5*(X)) + minsize

其中X是要映射到的字體大小歸一化的值

X = (this_value-min_value)/(max_value-min_value)

這增加尺寸差爲降低3個四分位的範圍,例如以最小化高異常值的影響