2017-02-09 51 views
0

在我的數據框窗口的頂部,有一個搜索框。當我搜索我的推特專欄「特朗普」時,它會提取所有包含特朗普的推文。R - 是否有代碼的方式來做R搜索?

有沒有辦法通過代碼執行此搜索?

我想創建一個可變的,使得

All_Twitter_Data$Keyword_Trump <- 0 
All_Twitter_Data$Keyword_Trump[ **SUBSET OF TWEETS THAT CONTAIN TRUMP** ] <-1 

編輯1:

All_Twitter_Data$Keyword_Trump <- 0 
All_Twitter_Data$Keyword_Trump[grepl("Trump", ignore.case=TRUE, fixed=TRUE)] <-1 

返回

Error in grepl("Trump", ignore.case = TRUE, fixed = TRUE) : 
    argument "x" is missing, with no default 

編輯2:(基於式兩份)

vGrep <- Vectorize(All_Twitter_Data, vectorize.args="Trump") 

回報

Error in Vectorize(All_Twitter_Data, vectorize.args = "Trump") : 
    must specify names of formal arguments for 'vectorize' 
+1

取代'** **塞入用''grepl( 「特朗普」,ignore.case = TRUE,fixed = TRUE)'可能。 – lmo

+0

我很難找到一個好的模糊,[基於搜索模式的數據框子集](http://stackoverflow.com/q/20440915/903061)是好的,但可能有更好的一個。 – Gregor

+0

@lmo試過了,出現錯誤。發佈了一個更新,所以你可以看到 –

回答

0

這將返回我一直在尋找的變量:

df$Keyword_Column <- 0 
df$Keyword_Column[grep(as.character(df$text_column),ignore.case=TRUE, pattern=paste0("insertword"))] <-1 

這會返回一個計數:

# count word frequency 
wordfreq <- function(data, word) { 
    results <- lapply(data, 
        function(x) { grep(as.character(x), 
        ignore.case=TRUE, pattern=paste0(word)) } 
) 
    sum(unlist(results)) 
}