0
我想解析表使用機械化寶石,但我不知道如何迭代表。如何使用機械化寶石在html頁面的'table'標籤中獲取'td'標籤內的所有文本?
我想解析表使用機械化寶石,但我不知道如何迭代表。如何使用機械化寶石在html頁面的'table'標籤中獲取'td'標籤內的所有文本?
機械化使用nokogiri
解析HTML,所以你應該查看那裏的文檔。也就是說,看看xpath
的方法。
下面是一個例子,分析當前頁面:
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open('http://stackoverflow.com/questions/4265745/how-to-get-all-text-inside-td-tags-from-table-tag-on-html-page-using-mechaniz'))
table = doc.xpath('//table').first # getting the first table on the page
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them
#=> 4