2016-12-15 200 views
-1

我正在尋找一個類似於FindReplace的函數,這將允許我根據矢量而不是單個值映射值。R用矢量映射的值映射

我有一個看起來像這樣的查找表,我想用它來映射數據框中的值。

Headers: COLUMN_NAME, CODE, DESCRIPTION 
Row1: arrmin, 97, Officially Cancelled 
Row2: arrmin, 98, Unknown if Arrived 
Row3: atmcond, -1, Blank 
Row4: atmcond, 0, No Additional Atmospheric Conditions 

此查找表有成千上萬行的,所以我不能手動輸入他們,和我原來的解決方案是效率太低,將需要數天才能運行。

我使用具有幾百列如arrminatmcond需要從97改變的值,以正式取消該

的值從0-100(或然而許多值有)數據幀,等等。根據它所在的列進行更改。我已經在下面編寫了這些代碼,但它效率非常低,需要幾天才能運行30萬行。

columnsToReplace <- which(colnames(CRASH) %in% CapitalColumns) 
dfColumns <- colnames(CRASH) 
for (i in columnsToReplace){ 
    tempColumn <- dfColumns[i] 
    tempLookup <- capitalLookupTable[which(capitalLookupTable$COLUMN_NAME ==tempColumn),] 
    CRASH <- FindReplace(data=CRASH,Var=tempColumn,replaceData = capitalLookupTable, 
      from = "Code",to = "Description",exact=T) 
} 

columnsToReplace是我創建了一個包含每個中存在的查找表中的列的字符串名稱的向量。

回答

0
#Some data 
s<-data.frame(A=c(1,1,2,2),B=c(2,4,6,6),C=c(1,3,5,7)) 
mapping<-data.frame(ColumnName=c(rep("A",2), rep("B",3), rep("C",4)), Code=c(1,2,2,4,6,1,3,5,7)) 
mapping$Description<-paste0(mapping$ColumnName, mapping$Code) 

#From wide to long 
library(reshape) 
melted.s<-melt(s) 

#Join 
melted.s<-merge(melted.s, mapping, by.x=c("variable","value"), by.y=c("ColumnName","Code")) 

#From long to wide 
p<-data.frame(matrix(melted.s$Description, ncol=ncol(s))) 
names(p)<-names(s)