我能夠在str.default(tweets_text)與轉換爲字符下面的代碼我收到錯誤時獲得500個鳴叫在與R但是：無效的多字節字符串53錯誤str.default（tweets_text）：無效的多字節字符串53

tweets_b <-searchTwitter('bahubali',lang="en",n=500,resultType="recent") 
tweets_txt <-sapply(tweets_b,function(x) x$getText()) 
str(tweets_txt)

有人可以幫我嗎？

2015-08-16 gulla.santosh

什麼包您使用的歡呼？請添加庫調用 –

庫（Twitter）上庫（RCurl）庫（httk）庫（httpuv）要求（TM）要求（wordcloud）tweets_b <-searchTwitter（「＃bahubali」，LANG = 「EN」， N = 500，與resultType = 「最近」）類（tweets_b） #convert在從列表數據類型文本 tweets_txt <-sapply（tweets_b，函數（X）×$的getText（）） STR（tweets_text） b_corpus <-Corpus（VectorSource（tweets_text）） –

您可以檢查並確認錯誤信息 –

的錯誤是因爲編碼的，通過使用代碼

Encoding(tweets_txt)

檢查您的編碼。如果你看到任何UTF-8編碼，可以通過轉換編碼爲latin1，通過使用這種克服錯誤代碼

Encoding(tweets_txt) <- "latin1"

之後，str()將工作。

來源

2017-01-05 09:18:52

謝謝你的回答，但是我已經把這個決議早已算回來併成功地實施了。

供參考：

這是我使用的代碼。

bahubali_text < - sapply（bahubali_tweets，函數（x）x $的getText（））

去除語料庫非ASCII chracters

b_convert_text < - sapply（bahubali_text，函數（行）的iconv（排在「latin1」，「ASCII」，子= 「」））

再次感謝

來源

2017-01-06 14:08:54

錯誤str.default（tweets_text）：無效的多字節字符串53

回答

去除語料庫非ASCII chracters

相關問題