這是我的第一篇文章,請原諒任何不規範行爲。我正在使用R進行文本分析,目前正試圖總結我的數據框在另一列的條件。具體來說,我的結果「dfResults」看起來如下:如何根據另一列求和一列
我想算對所有正詞的詞頻率(1)和所有否定詞(-1)分開的頻率,這樣我可以輕鬆計算情緒分數。這可能很容易,但我嘗試了聚合函數和求和函數,但它不起作用。將不勝感激的幫助!
這是我的第一篇文章,請原諒任何不規範行爲。我正在使用R進行文本分析,目前正試圖總結我的數據框在另一列的條件。具體來說,我的結果「dfResults」看起來如下:如何根據另一列求和一列
我想算對所有正詞的詞頻率(1)和所有否定詞(-1)分開的頻率,這樣我可以輕鬆計算情緒分數。這可能很容易,但我嘗試了聚合函數和求和函數,但它不起作用。將不勝感激的幫助!
希望這是你想要什麼:
library(dplyr)
data %>% group_by(sentiment) %>% summarise(x = sum(freq))
您能否解釋倒票?做過的人 –
兩個以上的答案會工作。此外,如果你想這樣做,而無需使用任何庫,基本的方式,那麼你至少有兩個選項
split()
的數據和lapply總結得到的名單/ sapply,或use aggregate()
lapply ((split(df$freq,df$sentiment)), sum)
aggregate(df$freq, by=list(df$sentiment), FUN=sum)
編輯/校正 - aggregate
不是從基地而是從stats
包。但是,假設stats
也是默認軟件包之一,它在R會話中可用。
group by'sentiment'然後求和freq –
請顯示您在R中編寫的代碼和數據集。 –