Q

提取文本

2017-04-04 83 views 1 likes

1

我從網頁拉取的日期和有一個很難提取文本提取文本

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') 
## prints ## 
# {xml_nodeset (1)} 
# [1] 2017-03-27

我嘗試添加``[[(1L)或date_[[1]] 但這打印

{xml_node} 
<text>

我只想提取2017-03-27

2017-04-04 R.M.

A

回答

2

只是用html_text

由於函數名稱0123'返回指向節點的指針。爲了從這些信息使用html_text和html_attr

更改第一行：

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()

2017-04-04 12:44:14 Rentrop

相關問題