2017-07-19 73 views
0

我想將Quanteda軟件包的結果添加到現有的電子表格中。例如:將KWIC插入R中的現有數據框

newdf<- as.data.frame(kwic(x, keywords, window = 5, 
valuetype = c("glob", "regex", "fixed"),case_insensitive = TRUE, ...)) 

這會創建一個包含多列的數據幀。我希望將它添加到它來自的數據(在這種情況下是x),然後對其餘的數據進行NULL或NA處理。

在dplyr中變異是正確的嗎?還是我需要別的東西?

謝謝!

回答

0

kwic()返回已經是data.frame,所以不需要as.data.frame()。您將無法「將其添加到x」,但是因爲從kwic()返回的每個關鍵字匹配都是一行,您的原始數據x是一個字符或語料庫對象,每個文檔組織「行」。

但是,可以從該函數返回的kwic對象直接創建一個語料庫,利用corpus(kwic(x, ...))或者如果你喜歡管道,

require(magrittr) 
kwic(x, ...) %>% corpus 

注意當然,在這裏,x, ...將被你的論點所取代。