我有一個使用XML包從Twitter搜索中創建的1500行向量。然後我將它轉換爲語料庫以與tm包一起使用。我想最終創建一個帶有一些(最頻繁)這些詞的wordcloud,因此我將它轉換爲TermDocumentMatrix以便能夠以最低頻率找到詞。我創建了對象「a」,它是這些術語的列表。從R中的語料庫創建單詞的子集
a <- findFreqTerms(mydata.dtm, 10)
wordcloud軟件包在文檔矩陣上不起作用。所以現在,我想過濾原始矢量,只包含「a」對象中包含的詞(如果我使用對象本身,當然,我只有每個常用詞的一個實例)。
任何建議,非常感謝。
嗨,歡迎來到SP。你能否粘貼一下你的數據樣本?你可以使用'dput(myData)'如果它太大,你可以使用'dput(head(myData,10))' – 2013-03-19 15:08:02
可能的重複:http://stackoverflow.com/q/15506118/1036500 – Ben 2013-03-19 18:09:58