我有一個HTML文檔解析並從那裏讀取一堆東西。問題是html中有多個表格,我只對一個表格感興趣。另外,我只想閱讀一些有用的內容。這裏是示例html頁面,有兩個沒有ID的表格,我只需要第二個表格,而且只需要對人類有用的行。Ruby - nokogiri - 只解析特定的html表格
<HTML>
<BODY>
<TABLE>
<TR>
<TD> I don't want this table </TD></TR>
<TR>
<TD></TD>
<TD> No No No <br></TD>
</TR>
....
</TABLE>
<TABLE>
<TR>
<TD>04/13/2012 22:51 I want this table </TD></TR>
<TR>
<TD></TD>
<TD> First - something there <br></TD>
</TR>
<TR>
<TD>04/13/2012 23:23 Update from xyz</TD></TR>
<TR>
<TD></TD>
<TD>Second - something here <br></TD>
</TR>
</TABLE>
</BODY>
</HTML>
我想這個代碼,顯然不工作。 o/p不是我想要的文字。它包括兩個表格,我只想要第二個表格。幫幫我!
require 'curb'
require 'nokogiri'
c = Curl::Easy.perform("http://server/cgi-bin/page.cgi?id=123456")
html_doc = Nokogiri::HTML(c.body_str.to_s)
puts html_doc.xpath("//table/tr/td")
知道了! 'require'curb' require'nokogiri' c = Curl :: Easy.perform(「http://server/cgi-bin/page.cgi?id=123456」) html_doc = Nokogiri :: HTML( c.body_str.to_s) puts html_doc.xpath(「// table [2]/tr/td/text()」)' – 2012-04-14 07:06:06