2014-10-19 60 views
1

是否有一種簡單的方法可以使用twitter4j刪除推文中提到的hashtags,用戶名和URL?我知道使用getHashtagEntities(),getUserMentionEntities()和getURLEntities()我可以檢索這些實體及其在字符串中的位置,但我將如何使用它們來「清理」tweets?使用Twitter4j從推文中刪除hashtags,用戶名和URL

我正在考慮使用replaceAll(entity,「」)方法用「」替換推文中的所有實體,但這並不總是會給出正確的結果(例如.eg它會將#ht從「 #ht「即使它不應該鳴叫)。

回答

1

我結束了對每個實體使用lookbehind "(?<!\w)"replaceAll()方法,我想這解決了我的問題。不過我被告知,正則表達式和replaceAll()方法可能會很慢,所以如果有人有任何其他建議,我會很樂意閱讀它們。

+0

什麼類實現了這個removeAll? – perrohunter 2014-12-03 08:58:48

+0

對不起,我打算編寫replaceAll()。我正在使用String對象。 – GeorgeG 2014-12-03 20:42:22