1
我想解析一個使用Jsoup的HTML文件。 HTML中有某些文本不在標籤下。解析一個複雜的li標籤
<li class="inactive">
<span class="status label">inactive</span>
<a href="/officers/144662696" class="officer inactive" title="more info on MILLTOWN CORPORATE SERVICES">
MILLTOWN CORPORATE SERVICES
</a>
member,
<span class="status label">inactive</span>
<a href="/companies/us_wv/193180" class="company inactive revoked_(failure_to_file_annual_report)" title="More Free And Open Company Data On EASTBRIDGE L.L.C. (West Virginia (US), 193180)">
EASTBRIDGE L.L.C.
</a>
(West Virginia (US),
<span class="start_date">25 May 2000</span>-<span class="end_date"> 1 Aug 2002</span>)
</li>
我能夠讀取標籤的所有內容,但我想獲得價值(西弗吉尼亞州美國)和成員。
有沒有辦法在類之外和li
標籤內獲取值。
不確定jsoup,但您可以嘗試獲取元素的'innerHTML'。尋找暴露元素的html而不是文本值的api – TheChetan
我已經使用Jsoup提取了所有其他字段。但我會嘗試去獲得innerHTML。 – Vini