我有一個數據框,其中包含三個列,分別爲站點ID,樣本日期和測量值。這是一個理論數據集。根據不同的日期要求過濾行
Dates <- data.frame(c(as.Date("2008-7-1"),
rep(as.Date("2008-3-1"), times = 4) ,
rep(as.Date("2008-9-1"), times = 4),
as.Date("2008-9-8")))
Sites <- as.data.frame(as.factor(c("Site1",rep(c("Site1","Site2","Site3","Site4"), 2),
"Site1")))
Values <- data.frame(matrix(sample(0:50, 5*2, replace=TRUE), ncol=1))
Dataframe <- cbind(Dates,Sites,Values)
colnames(Dataframe) <- c("date","site","value")
我篩選出不符合某些標準的特定樣本。
首先,我只想選擇春季和秋季的樣品。所以我想在3月 - 5月和9月 - 11月之間選擇網站,這意味着數據框中的第一行將被刪除。難道還有比下面的一個更好的辦法:
library(dplyr)
Season_sequence <- c(seq(as.Date("2008-3-1"),
as.Date("2008-5-31"), by="days"),
seq(as.Date("2008-9-1"),
as.Date("2008-11-30"), by="days"))
`%datein%` <- function(x,y) (x %in% y)
Season_removed <- Dataframe %>%
filter(date %datein% Season_sequence)
這工作,但如果我有樣了好幾年,我不知道如何快速創建一個序列匹配這一點。
其次,我不希望在特定季節內來自特定網站的兩個樣本(即我不想要任何複製樣本),這意味着數據框中的最後一行將被刪除。我不知道如何從這一開始。
謝謝。這非常棒,非常接近!但是,不是每個網站都不同,有沒有創建網站/季節組合ID並使用不同的方法?即我想保留所有站點的春季和秋季樣本。 –
只是糾正這一點;-)更好? – ztl
完美謝謝! –