0
我想用Jsoup獲取網頁的所有超鏈接。同時,我想忽略所有圖像的超鏈接。是否可以爲getElementsByTag添加更多限制?如何獲得所有的超鏈接,但忽略圖像的鏈接
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
我想用Jsoup獲取網頁的所有超鏈接。同時,我想忽略所有圖像的超鏈接。是否可以爲getElementsByTag添加更多限制?如何獲得所有的超鏈接,但忽略圖像的鏈接
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
如果圖片是用src
-attribute a
標籤鏈接(而正常鏈路使用href
)使用此:
Document doc = Jsoup.connect(url).timeout(1000).get();
Elements links = doc.select("a[href]"); // Only select 'a'-tags with 'href' attribute
爲jsoup選擇API見here。