如何在用XPath提取的HTML文本（）中包含空字符串？

header | value 
---------------- 
field1 | 1 
field2 | 
field3 | 1 
field4 | 
field5 | 1

當我選擇值時，我需要得到相同的數字，因爲有字段。我得到正確的號碼：

>s = scrapy.Selector(response) 
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]').extract() # get the second column 
>len(values) 
5

但是：

>s = scrapy.Selector(response) 
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]/text()').extract() # get the values 
>len(values) 
3

我以後可以清除第一個列表，但有XPath中/ Scrapy這樣做的一杆呢？

2017-02-22 Jamie Bull

這工作，但就是那種醜陋：

values = [v.xpath('text()').extract() 
      for v in s.xpath('//tr/td[@class="tdMainBottom"][2]')]

2017-02-22 20:05:50

回答