我試圖處理一些名爲xls的文件,並且可以在Excel中打開它們但是它們是web檔案文件有一些嵌套表,我想首先與非嵌套表一起工作。我認爲我可以通過只查找那些父元素具有body標籤但沒有我的表的表是table.get_parent()。tag =='body'true的表來捕獲非嵌套表。即使對於特定表的父元素的標籤下表剪斷是div標籤當使用LXML爲什麼正文元素不是這個html元素的表格元素的父元素
<html>
<head>
<META http-equiv=3DContent-Type content=3D'text/html; charset=utf-8'><script type=3Dtext/javascript src=3DShow.js>/* Do Not Remove This Comment */</script></head>
<body>
<table class=3Dreport id=3DID0EI>
<tr>
<th>
我檢查和身體標記被關閉爲是表標記。
table.getparent()
回報
<Element div at 9f05f10>
筆記,我通過閱讀文檔作爲字符串和以下一般步驟
myTree=html.fromstring(someString)
tables=myTree.cssselect('table')
tables=theTree.cssselect('table')
選擇由CSS可能會返回另一個在其他地方的div中的表? – 2012-02-24 20:52:08