2016-06-01 80 views
1

http://www.aqistudy.cn/historydata/daydata.php?city=%E8%8B%8F%E5%B7%9E&month=201504 這是從我的網站我想讀取的數據。使用R讀取html,但得到了一個錯誤

我的代碼如下,

library(XML) 
fileurl <- "http://www.aqistudy.cn/historydata/daydata.php?city=蘇州&month=201404" 

doc <- htmlTreeParse(fileurl, useInternalNodes = TRUE, encoding = "utf-8") 

rootnode <- xmlRoot(doc) 

pollution <- xpathSApply(rootnode, "/td", xmlValue) 

但是我得到了很多的亂碼,我不知道如何解決這個問題。

我很感謝您的幫助!

+0

你怎麼想就「固定」表可以簡化 - 你有什麼希望擺脫它? – SymbolixAU

+0

我只想讀取頁面的表格! – lacfo

回答

1

這可以通過使用library(rvest)直接讀取

library(rvest) 

url <- "http://www.aqistudy.cn/historydata/daydata.php?city=%E8%8B%8F%E5%B7%9E&month=201504" 

doc <- read_html(url) %>% 
    html_table() 

doc[[1]] 
#   日期 AQI 範圍 質量等級 PM2.5 PM10 SO2 CO NO2 O3 排名 
# 1 2015-04-01 106 67~144 輕度污染 79.3 105.1 20.2 1.230 89.5 76 308 
# 2 2015-04-02 74 31~140  良 48.1 79.7 18.8 1.066 51.5 129 231 
# 3 2015-04-03 98 49~136  良 72.9 89.2 16.0 1.323 50.9 62 293 
# 4 2015-04-04 92 56~158  良 67.6 78.2 14.3 1.506 57.4 93 262 
# 5 2015-04-05 87 42~167  良 63.7 56.1 16.9 1.245 50.8 91 215 
# 6 2015-04-06 46 36~56  優 29.1 30.8 10.0 0.817 37.5 98 136 
# 7 2015-04-07 45 34~59  優 27.0 42.4 12.0 0.640 36.6 77 143 
+0

非常感謝!它可以節省大量時間來獲取數據! – lacfo

+0

'日本AQI鑼冨洿璐噺絳絳夌PM2.5 PM10 SO2 CO NO2'頭像我是這樣的,你知道它有什麼問題嗎?謝謝! – lacfo

+0

你是什麼意思'它有什麼問題'?我假設,因爲它是中文網站,它們是中文字符... – SymbolixAU

相關問題