2015-08-16 63 views
0

我能夠在str.default(tweets_text)與轉換爲字符下面的代碼我收到錯誤時獲得500個鳴叫在與R但是:無效的多字節字符串53錯誤str.default(tweets_text):無效的多字節字符串53

tweets_b <-searchTwitter('bahubali',lang="en",n=500,resultType="recent") 
tweets_txt <-sapply(tweets_b,function(x) x$getText()) 
str(tweets_txt) 

有人可以幫我嗎?

+0

什麼包您使用的歡呼?請添加庫調用 –

+0

庫(Twitter)上 庫(RCurl) 庫(httk) 庫(httpuv)要求(TM) 要求(wordcloud)tweets_b <-searchTwitter( 「#bahubali」,LANG = 「EN」, N = 500,與resultType = 「最近」) 類(tweets_b) #convert在從列表數據類型文本 tweets_txt <-sapply(tweets_b,函數(X)×$的getText()) STR(tweets_text) b_corpus <-Corpus(VectorSource(tweets_text)) –

+0

您可以檢查並確認錯誤信息 –

回答

0

的錯誤是因爲編碼的,通過使用代碼

Encoding(tweets_txt) 

檢查您的編碼。如果你看到任何UTF-8編碼,可以通過轉換編碼爲latin1,通過使用這種克服錯誤代碼

Encoding(tweets_txt) <- "latin1" 

之後,str()將工作。

0

謝謝你的回答,但是我已經把這個決議早已算回來併成功地實施了。

供參考:

這是我使用的代碼。

bahubali_text < - sapply(bahubali_tweets,函數(x)x $的getText())

去除語料庫非ASCII chracters

b_convert_text < - sapply(bahubali_text,函數(行)的iconv(排在 「latin1」, 「ASCII」,子= 「」))

再次感謝

相關問題