我正在使用Scrapy進行屏幕抓取項目,並且遇到XPath問題。XPath不能用於屏幕抓取
我想從下面的圖像中獲得94,218,但我用過的XPath和CSS不起作用。
這是從這個頁面:https://fancy.com/things/280558613/I%27m-Fine-T-Shirt
我已經試過多次的XPath和CSS與Scrapy但一切都返回空白。
下面是一些例子:
response.xpath('/html/body/div[1]/div[1]/div[1]/aside/div[1]/div/div/a[2]/text()').extract()
response.xpath('//*[@id="sidebar"]/div[1]/div/div/a[2]/text()').extract()
response.xpath('//*[contains(concat(" ", @class, " "), concat(" ", "fancyd_list", " "))])'.extract()
response.xpath(".//*[@id='sidebar']/div[1]/div/div/a[2]/text()")
我試過螢火蟲,Firepath,Chrome瀏覽器開發工具和不同的插件,但沒有的XPath或CSS似乎工作..有人可以幫助?
實際網頁上的代碼是:
<a href="#" class="fancyd_list "/>
6
</a>
一些的XPath的工作,但他們不包含文本,所以它看起來是這樣的:<a href="#" class="fancyd_list "/></a>
我使用BeautifulSoup也試過,但它有同樣的問題:
print soup.find_all('a',class_='fancyd_list')
[<a class="fancyd_list " href="#"></a>, <a class="fancyd_list " href="#"></a>]
謝謝!
這種類型的解析總是讓我瘋狂。使用'美麗的湯',我敢打賭這將是微不足道的。 – RobertB
嘿謝謝@RobertB會給出一個破解,遠離它,因爲我聽到的表現並不是最好的 – bnussey
嘿@RobertB只是試過BeautifulSoup並得到了同樣的問題 – bnussey