通過jsoup

java
jsoup

2016-11-10 59 views 1 likes

獲取除了div標籤從表（HTML）的數據我的html代碼：通過jsoup

<table width="100%" cellpadding="5" cellspacing="2" class="zebra"> 
    <tr> 
    <td colspan="5"> 
    <div class="paginator"> 
    <a href="http://some_link">2</a>&nbsp;   
    </div> 
    </td> 
    </tr> 
    <tr> 
    <td><a href="//i_need_only_this_link">some_value</a></td>  
    </tr> 
    <tr>  
    <td><a href="//i_need_only_this_link1">some_value</a></td>  
    </tr> 
    <tr> 
    <td colspan="2"> 
    <div class="paginator">   
    <a href="http://some_link">2</a>&nbsp; 
    </div> 
    </td> 
    </tr> 
</table>

我用Jsoup。我如何獲得除div標籤中的鏈接以外的所有鏈接？我嘗試做這樣的事情，但它不起作用。元素包含所有鏈接。

org.jsoup.nodes.Elements tableText = doc.select("table.zebra").not("tr td div.paginator"); 

for (org.jsoup.nodes.Element td : tableText.select("td a")) { 
    System.out.println(td.attr("href")); // http://some_link 
    .... 
    }

來源

2016-11-10 Helen

回答

您可以使用下面的代碼..

Document html = Jsoup.parse(htmlStr); 

    for (Element e : html.getElementsByTag("a")) { 

     if (!"div".equalsIgnoreCase(e.parentNode().nodeName())) { 
      System.out.println(e.attr("href")); 
     } 

    }

在這裏，我檢查錨元素的父節點不是股利。如果它不是div我打印的網址。

來源

2016-11-10 11:13:56 Jobin

儘管使用'「abs：href」'可能是個好主意：https：//jsoup.org/cookbook/extracting-data/working-with-urls –

相關問題

1. 不是通過jsoup
2. 網站通過Jsoup
3. 如何通過jsoup
4. jsoup URL首先通過變量
5. 通過Jsoup更新Facebook狀態
6. 通過Jsoup在網站上登錄
7. 推特通過Jsoup Java登錄Android
8. 如何通過Ant編譯jsoup？
9. Jsoup循環通過ol li標籤
10. 我想通過在地圖的屬性值Jsoup Connect.data（）方法
11. 通過Java與jsoup加載嵌套鏈接
12. 通過Jsoup登錄是否可以保存？
13. 如何通過Jsoup使用元素im：image獲取XML？
14. JSoup通過屬性值抓取HTML文檔
15. 如何使用Jsoup通過HTTPS進行連接？
16. 如何僅通過Jsoup獲得第一級節點
17. JSoup java.nio.charset.UnsupportedCharsetException
18. 取Jsoup
19. Jsoup getElementsByTag
20. 與jsoup
21. 在jsoup
22. 與Jsoup
23. 與Jsoup
24. JSoup HttpStatusException
25. 通過使用JSoup下載URL來設置多個圖像查看源？
26. Weird java.lang.ExceptionInInitializerError - JSoup
27. 不能與Jsoup
28. Jsoup和Android
29. JSoup獲取表
30. JSoup select numbers