2012-12-13 49 views
1

我嘗試使用下面的代碼解析網頁,但最後一行顯示「未能加載HTTP資源」的輸出。任何人都可以告訴我如何處理它?謝謝! 的代碼是:無法加載R中的HTTP源

library(XML);library(RCurl) 
page=getForm("http://jobsearch.monster.com/search",query="data science") 
doc = htmlParse(page, asText = TRUE) 
joblinks = getNodeSet(doc, "//div[@class = 'jobTitleContainer']//a/@href") 
htmlParse(joblinks[[1]]) 
+0

你期待它輸出什麼?它似乎按預期工作 –

+0

真的嗎?但在我的電腦上,它顯示「錯誤:無法加載HTTP資源」 – user1787675

+0

您嘗試將網頁加載到瀏覽器中嗎? –

回答

-1

兩件事情,?htmlParse將指向你的isURL標誌,默認爲FALSE。你想把它設置爲TRUE。

其次,joblinks[[1]]中的網址似乎不起作用。這似乎並非是一個問題與您的R代碼,只是信息你是拉:

# works 
htmlParse("http://stackoverflow.com/questions/13852853/failed-to-load-http-source-in-r", isURL=TRUE) 

# doesnt work 
htmlParse("http://jobview.monster.com/Cleaning-Supervisor-Job-1513-Rebel-Southwest-OH-117109119.aspx", isURL=TRUE)