3
我想讀和提取的XLS文件是真的單個文件網頁上看到下面是否有一個主標籤列表中的標籤及其含義爲mhtml文件?
This document is a Single File Web Page, also known as a Web Archive file.
我試圖找出所有標記的含義,所以我可以保證我分析他們的數據正確使用lxml。
例如這裏是一個標籤的例子:
<th class=3Dtl colspan=3D1 rowspan=3D2
雖然我有成功,有我在玩弄我想嘗試弄清楚,如果我提出的假設將在幾個文件的工作後回來困擾我。因此,這些標籤及其含義的列表會很好。