2017-10-17 53 views
-3

我有一張數據框,裏面包含了大學學生的停車許可證信息。我有很多信息,但我所尋找的模式是針對不同學年回頭客。讓我告訴你我擁有什麼和需要什麼的基本概念。從數據中提取模式

Student.ID Date.bought  Academic.year Parking.Lot 
001   Sept 7, 2008 Freshmen  West 
001   Sept 2, 2009 Freshmen  West 
001   Aug 10, 2010 Sophomore  East 
002   Aug 12, 2009 Freshmen  North 
002   Sept 4, 2011 Junior   North 

我想爲在今年大一新生買誰的人,大一大二+,新生+大二+大四了,基本上其他的組合標誌。有人會幫我舉幾個例子,所以我可以自己創建其他排列?

期望的最終結果看起來像這樣。

Student.ID Freshmen  Fresh.Soph Fresh.Junior 
001   1   1   0 
002   1   0   1 

對於我創建的每個排列,基本上都是真/假。

+0

什麼會從樣本數據的輸出提供? – wallyk

回答

0

簡單:

df1 <- model.matrix(~Student.ID + Academic.year -1, data=df1) 

df1 <- as.data.frame(df1) 

aggregate(. ~ Student.ID, data=df1,max) 
+0

我想我不能正確表達我的問題。我正在尋找組合。因此,在001學生的情況下,他們在新生和大二學年購買了停車證,所以我想寫一個「如果你爲新生和大二學生購買了停車證」的專欄。在學生001的情況下,他們會在那裏獲得真實的價值,對於學生002他們會是假的。在「您是否爲您的新生和大三學生購買停車許可證」一欄中,學生001將有錯誤,學生002將具有真實價值。 – Xanman