2017-04-04 83 views
1

我從網頁拉取的日期和有一個很難提取文本提取文本

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') 
## prints ## 
# {xml_nodeset (1)} 
# [1] 2017-03-27 

我嘗試添加``[[(1L)date_[[1]] 但這打印

{xml_node} 
<text> 

我只想提取2017-03-27

回答

2

只是用html_text

由於函數名稱0123'返回指向節點的指針。爲了從這些信息使用html_texthtml_attr

更改第一行:

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()