2010-07-20 62 views
0

我想按自己的方式對分類變量進行排序。我已將我的數據集分組爲「1-5」,「6-10」,「11-20」....「> 251」等類別。如果繪製變量或在表格中顯示它們的圖例序列,則標籤中的序列會「混亂」。我以自己的方式在R中排序變量

這並不奇怪,因爲R不知道這些無序變量實際上是有序的。有沒有辦法給他們附加一個手動定義的序列?

thx任何建議提前!

+2

請您提供一些示例代碼(最小的,可重現的),以便我們可以確切地看到您正在嘗試做什麼。 – 2010-07-20 12:20:16

+0

我同意,你的問題的答案已經提供,當你的措辭稍早不同。答案仍然相同,cut()。 – John 2010-07-20 13:45:58

+0

我不認爲cut()是更一般的重排序因素問題的答案。下面我的2c。 – 2010-07-20 18:13:40

回答

4

分類變量在繪製時存儲爲(或轉換爲)factor。它們在圖中出現的順序取決於因子的級別。您可能想使用cut創建您的羣組。例如

dfr <- data.frame(x = runif(100, 1, 256)) 
dfr$groups <- cut(dfr$x, seq(1, 256, 5)) 

這個問題也很類似於another recent SO question

+2

事實上,這個建議似乎只是rcs告訴你你以前的問題http://stackoverflow.com/questions/3288361/create-size-categories-without-nested-ifelse-in-r – 2010-07-20 12:26:06

+0

是的,你'再右吧。顯然我需要仔細看看這個剪切函數。剛剛使用ifelse到目前爲止...... thx指出它。此外,我仍然有興趣重新安排訂單,一旦我設置錯誤的方式... – 2010-07-20 12:58:47

+0

cut()將允許您設置訂單。如果您需要進一步控制,factor()允許您設置順序。 – John 2010-07-20 13:47:32

4

當我想設定一個係數不同的順序手動(乏味,但有時是必要的),這裏是我做的:

> ## a factor 
> x <- factor(letters[1:3]) 
> ## write out levels with dput 
> dput(levels(x)) 
c("a", "b", "c") 
> ## copy, paste, modify and use factor again. e.g. 
> x <- factor(x, levels=c("b", "a", "c")) 
> x 
[1] a b c 
Levels: b a c 
+0

有趣的使用'dput'。 – 2010-07-23 16:18:26

-1

我喜歡用split對於諸如此類的事情。

VECT = runif(10)

vect.categories = C(REP(LETTERS [1],5),代表(LETTERS [2],3),代表(LETTERS [5],2 ))

category.list =拆分(VECT,vect.categories)

....

可能不相關,但認爲我會提供建議。