2012-09-24 25 views
2

在我的嘗試,我試着就像你會爲從一個元素中提取數據A HREF 如<tr><td><a href = "www.somelink.com">hxs.select('//tr/td/a/@href').extract() 所以我們在這裏做越來越被分配給HREF如何從屬性元素中在寫有scrapy蜘蛛拉數據

我有一個具有一個類,因此 <span class="classname" data="{...data in here...}">

數據屬性但跨度元件中的數據嘗試下面的產生在scrapy,錯誤其中IM選擇的數據屬性span元素class = classname的span元素。

hxs.select('//div/span[@class="classname"]/@data/').extract()

它甚至有可能從比HREF其他屬性中提取數據,如果是的話我該怎麼辦呢? 謝謝

回答

1

如果您在@data之後刪除尾部斜線,它會起作用嗎?

+0

這次沒有錯誤,只是一個空的列表.... [] – zoonosis

+0

這可能是HTML解析器不允許span元素上的「data」屬性,因此在解析時忽略了它。你可以嘗試提取'/ div/span [@ class =「classname」]/@ *'來查看它認爲在那裏的屬性。 –

+0

等待,我的胖手指給了我錯誤的答案。這是額外的/謝謝堆 – zoonosis