0
我有一個由兩列組成的頁面。如何在用XPath提取的HTML文本()中包含空字符串?
header | value
----------------
field1 | 1
field2 |
field3 | 1
field4 |
field5 | 1
當我選擇值時,我需要得到相同的數字,因爲有字段。我得到正確的號碼:
>s = scrapy.Selector(response)
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]').extract() # get the second column
>len(values)
5
但是:
>s = scrapy.Selector(response)
>values = s.xpath('//tr/td[@class="tdMainBottom"][2]/text()').extract() # get the values
>len(values)
3
我以後可以清除第一個列表,但有XPath中/ Scrapy這樣做的一杆呢?