1
我有一個HTML頁面(seed)
形式的提取物對(HREF,ALT):如何王氏蟒蛇scrapy
<div class="sth1">
<table cellspacing="6" width="600">
<tr>
<td>
<a href="link1"><img alt="alt1" border="0" height="22" src="img1" width="92"></a>
</td>
<td>
<a href="link1">name1</a>
</td>
<td>
<a href="link2"><img alt="alt2" border="0" height="22" src="img2" width="92"></a>
</td>
<td>
<a href="link2">name2</a>
</td>
</tr>
</table>
</div>
我想什麼做的是循環到所有<tr>
的,並提取所有href, alt
與python scrapy配對。在這個例子中,我應該得到:
link1, alt1
link2, alt2