2017-07-07 65 views
0

guys, 我有一個問題,scrapy,選擇器,XPath 我想選擇HTML中最後一個「li」標籤中的「a」標籤中的鏈接,以及如何編寫XPath的查詢 我做了這一點,但我相信有更簡單的方法來做到這一點,如使用XPath查詢,不使用列表碎片,但我不知道怎麼寫scrapy xpath如何使用?

from scrapy import Selector 

sel = Selector(text=html) 
print sel.xpath('(//ul/li)').xpath('a/@href').extract()[-1] 


''' 
html 
''' 

</ul> 
<li> 
    <a href="/info/page/" rel="follow"> 
     <span class="page-numbers"> 
     35 
     </span> 
    </a> 
</li> 
<li> 
    <a href="/info/page/" rel="follow"> 
     <span class="next"> 
     next page. 
     </span> 
    </a> 
</li> 
</ul> 

回答

0

我假設你想具體的鏈接「下一頁。如果是這種情況,您可以找到一個a元素檢查孩子span到「下一個」類別:

//a[span/@class = "next"]/@href