2
我使用Jsoup從網頁中提取鏈接,但我想避免img鏈接。 所以下面的代碼:Jsoup選擇他們的孩子不包含特定標籤的元素
Document doc = Jsoup.connect(i_Url).userAgent("chrome/5.0").get();
Elements links = doc.select("a[href]");
會讓我所有的鏈接,但他們中的一些圖片。執行以下操作:
links.stream().filter(link -> !link.tagName().equals("img"));
不會起作用,因爲該元素的(=鏈接)孩子是一個與img標籤,例如:
<a href="index.htm" title="tutorialspoint">
<img alt="tutorialspoint" src="/java/images/logo.png">
</a>
我試過各種各樣的事情,如:
Elements links = doc.select("a[href]").select(":not(img)"); //or
Elements links = doc.select("a[href]:not(img)"); //or
Elements links = doc.select("a[href]")
links.stream().filter(link -> link.children().contains(Tag.valueOf("img")));
我只是試圖玩各種變化,他們都沒有工作。談到HTML,我不是一個大專家。 幫助,將不勝感激。由於