2011-11-26 48 views
0

我有一塊網頁(庫的東西)喜歡的HTML代碼:獲取隱藏在HTML代碼的URL與JSoup

<div class="qelcontent" id="4ed0e0ba4f1b16.47984984" style="display:block;"> 
<div class="description"><h4 class="first"><b>Amazon.com Product Description</b> 
(<a href="http://rads.stackoverflow.com/amzn/click/0860783227">ISBN 0860783227</a>, Hardcover)</h4> 

我想從一個href屬性得到絕對URL。我試過了:

selector = document.select(".first .a[href]"); 

但是它返回了null。我如何獲得價值?

+0

嗯,我試圖正是我上面寫的,結果我得到空。有什麼可發現..沒有匹配與選擇.. – tequilaras

+0

請提供網頁的URL。 – BalusC

回答

0

這解決了這個特定的問題..不知道它是否會與整個數據集一起工作。

String html = "<div class=\"qelcontent\" id=\"4ed0e0ba4f1b16.47984984\" style=\"display:block;\">" + 
    "<div class=\"description\"><h4 class=\"first\"><b>Amazon.com Product Description</b>" + 
    "(<a href=\"http://rads.stackoverflow.com/amzn/click/0860783227\">ISBN 0860783227</a>, Hardcover)</h4>"; 

    Document doc = Jsoup.parse(html); 
    System.out.println(doc.select(".first").select("a").attr("href"));