2017-03-19 38 views
1

我試圖做一些事情very similar to this question.故障使用Rvest刮

不過,我需要一個稍微不同的表。聽起來很簡單,對吧?但是我遇到了一個奇怪的例子,「相同的代碼在兩種情況下似乎工作方式不同」。這是一個簡單的測試例子。

如果我運行下面的代碼,第一個實例運行良好。第二個返回以下錯誤:

Error in UseMethod("html_table") : no applicable method for 'html_table' >applied to an object of class "xml_missing"

表名看起來與我在SelectorGadget中看到的一致。

library(rvest) 
url_splits <-"http://www.basketball-reference.com/players/i/ingrabr01/splits/" 
stats_splits <- read_html(url_splits) %>% 
      html_node("table#splits") %>% 
      html_table() 
url_college <-"http://www.basketball-reference.com/players/i/ingrabr01.html" 
stats_college <- read_html(url_college) %>% 
       html_node("table#all_college_stats") %>% 
      html_table() 

顯然有些東西一定是不同的,但我不能說出它是什麼。我嘗試使用xpath來選擇而不是相同的結果。有任何想法嗎?

回答

0

所以,我發現了答案。顯然,第二表嵌套評論a la this question.

在任何人的情況下跨該絆倒的內部,固定代碼如下:

stats_college <- url %>% 
      read_html %>% 
      html_nodes(xpath = '//comment()') %>% 
      html_text() %>% 
      paste(collapse='') %>% 
      read_html() %>% 
      html_node('table#all_college_stats') %>% 
      html_table()