2016-04-28 121 views
0

我在嘗試從網頁解析財務表。我繼續。但我不能夠安排名單,或data.frame從R,Rvest,Rcurl從網頁中刮取財務表

library(rvest) 
link <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter" 
read <- read_html(link) 
prs <- html_nodes(read, ".financials") 
irre <- html_text(prs) 
re <- strsplit(irre, split = "\r\n") 

re是這樣的:

[27] 「資產」
[28] 「」
[29] 「」
[30]「」
[31]「所有值TRY百萬。」
[32] 「31日 - 12月201431-MAR-201530君201530九月201531-DEC-2015」
[33] 「5-QTR趨勢」
[34] 「」
[35 ] 「」
[36] 「」
[37] 「」
[38] 「總現金&由於從銀行」
[39] 「27.26B26.27B26.7B34.51B27.9B」
[ 40]「」
[41]「」
bla bla ...

我如何通過data.frame編輯此列表,妥善這樣page

回答

0

嘗試

library(XML) 

theurl <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter" 
re <- readHTMLTable(theurl) 

結果是有兩個dataframes列表。

+0

固定。謝謝!! –