我想寫一個使用scrapy和xpath的web刮板,但我遇到了令人沮喪的問題。xpath和scrapy沒有讓文本變成具有多個屬性的段落
我需要擁有HTML
<p class="list-details__item__date" id="match-date">04.03.2017 - 15:00</p>
我可能是錯的段落中的文本,但由於P有一個id屬性,它應該是可借鑑簡單地使用
response.xpath('//p[@id="match-date"]/text()').extract()
反正這將無法工作。
我知道一些xpath,我可以在過去寫刮刀,但是這個給了我麻煩。我嘗試了許多解決方案,但似乎沒有人上班
response.xpath('//p[contains(@class, "list-details__item__date") and contains(@id,"match-date")]/text()').extract()
response.xpath('//p[@class="list-details__item__date" and @id="match-date"]/text()').extract()
我使用也嘗試過「載」在許多答案說明,但它並沒有正常工作。這可能是我正在做的一個愚蠢的錯誤......如果有人能夠幫助我,那將會很棒!
謝謝你這麼多
你的榜樣輸入顯示' 「比賽日」'用破折號,你的XPath使用'_'('「match_date」')。請嘗試'response.path('// p [@ id =「match-date」]/text()')。extract()' –
謝謝,這是由於複製/粘貼混亂造成的錯字...我修復了它現在 – peppuce
順便說一句我能夠從頁面中提取其他元素...這似乎給問題,因爲多個屬性 – peppuce