2012-07-19 114 views
0

我有一個像ba這樣的數據框。從數據框中提取並基於條件進行合併

我需要基於區域提取數據幀,並根據日期進行合併。

這是工作,如果我手動如下所示。但如果區域的數量超過兩個,我需要使用sapply進行提取,然後我需要合併(不知道如何使用循環或sapply)。請告訴我如何根據「區域」進行提取,然後動態地合併即使有兩個以上的區域(例如:betasol,alpha,atpTax)。

> ba 
      date region AveElapsedTime 
    1 2012-05-19 betasol   1372 
    2 2012-05-22 atpTax   1652 
    3 2012-06-02 betasol   1630 
    4 2012-06-02 atpTax   1552 
    5 2012-06-07 betasol   1408 
    6 2012-06-12 betasol   1471 
    7 2012-06-15 betasol   1384 
    8 2012-06-21 betasol   1390 
    9 2012-06-22 atpTax   1252 
    10 2012-06-23 betasol   1442 
    > dfa <- ba[ab$region == "atpTax", c("date", "AveElapsedTime")] 
    > dfb <- ba[ab$region == "betasol", c("date", "AveElapsedTime")] 
    > merge(dfa, dfb, by="date", all=TRUE) 
      date AveElapsedTime.x AveElapsedTime.y 
    1 2012-05-19    NA    1372 
    2 2012-05-22    1652    NA 
    3 2012-06-02    1552    1630 
    4 2012-06-07    NA    1408 
    5 2012-06-12    NA    1471 
    6 2012-06-15    NA    1384 
    7 2012-06-21    NA    1390 
    8 2012-06-22    1252    NA 
    9 2012-06-23    NA    1442 


    extractfun <- function(z, ab) { 
    df[z] <- ab[ab$region == z, c("date","region")] 
    } 
    sapply(unique(ba$region), FUN=extractfun, ab=avg_data) 

回答

2
require(reshape)  
cast(ba,date~region) 
+0

精彩......非常感謝你..它工作正常.. – Tamilan 2012-07-19 15:05:42