我有代碼來湊一個網頁,它會返回這多個實例:美麗的湯分揀輸出
<div class="post"><a title="Brass-plated door knob" href="http:URL-LINK">
<img src="IMAGE SOURCE LINK" alt="IMAGE ALTERNATE TEXT" />
<span class="det"><em class="fl">3.87 dollars</em><em class="fr">Housewares</em></span>
<strong class="vtitle">Brass-plated door knob</strong></a>
<div class="desc"><p>Brass-plated door knob</p></div></div>
我想獲得從每一個在href鏈接和相應的價格,對它們進行排序,具有理想的輸出是
HIGHEST PRICE, URL-LINK
'...
LOWEST PRICE, URL-LINK
我可以拉動價格(雖然他們與我可以做沒有「元」字)與
price = soup.find_all("em", class_="fl")
但不知道如何獲得相應的href鏈接,然後對它們進行排序和列出。
現在我通過輸出迭代如下:
if len(price) < 100:
for x in range(1, len(price)):
print price[x]
else:
print len(price)**
想法?
非常感謝亞歷克!請參閱Salman對後續評論的評論。 – Greg 2014-10-03 18:32:21
@Greg當然,我已將答案 - 收集結果更新到字典列表中。 – alecxe 2014-10-03 19:49:43