我檢索了不同追蹤期的各種hashtags的Twitter推文。例如,hashtag1被跟蹤了6天,Hashtag2跟蹤了4天,Hashtag3跟蹤了2天。我怎樣才能標準化每個hashtag?我怎樣才能將他們分成平等的宿舍?在此先感謝...以下是代碼......>如何使用R語言對直方圖中的推文進行標準化?
library(streamR)
library(rjson)
setwd("/Users/Desktop")
Tweets = parseTweets("Hashtag1.json")
table(Tweets$created_at)
dated_Tweets <- as.POSIXct(Tweets$created_at, format = "%a %b %d %H:%M:%S
+0000 %Y")
hist(dated_Tweets, breaks="hours", freq=TRUE, xlab="dated_Tweets", main=
"Distribution of tweets", col="blue")
你能告訴我們你怎麼弄,現在,解釋究竟是什麼你不滿意?你想爲每個hashtags每天_Weets _嗎? –
是的,我可視化每個hashtag的直方圖,但每個hashtag都有不同的跟蹤時間段,所以我想規範每個hashtag。例如,我想將24小時的每一天劃分爲4個季度(每6小時),然後將所有天數一起累積在同一個直方圖中。 – user3643380
所以你有推文時間戳。你想爲每條推文創建「每日季度」的直方圖?你想看看#2是否在更多的推文上,例如在早晨時分,而在晚上#4? –