2017-02-22 86 views
0

我有一個由兩列組成的頁面。如何在用XPath提取的HTML文本()中包含空字符串?

header | value 
---------------- 
field1 | 1 
field2 | 
field3 | 1 
field4 | 
field5 | 1 

當我選擇值時,我需要得到相同的數字,因爲有字段。我得到正確的號碼:

>s = scrapy.Selector(response) 
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]').extract() # get the second column 
>len(values) 
5 

但是:

>s = scrapy.Selector(response) 
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]/text()').extract() # get the values 
>len(values) 
3 

我以後可以清除第一個列表,但有XPath中/ Scrapy這樣做的一杆呢?

回答

0

這工作,但就是那種醜陋:

values = [v.xpath('text()').extract() 
      for v in s.xpath('//tr/td[@class="tdMainBottom"][2]')] 
相關問題