確定的數,所以我陷入瞭如何解決此問題在這裏。 這只是一個遊戲的在線人的私人計數器。LXML Python腳本,我怎麼能刪除重複的ID
經過一番研究,我設法到這個代碼,我平添了幾分上的搜索,以獲取所有圖像的數量與on.png ......而且它的實際工作!
from lxml import etree
import requests
def get_img_cnt(url):
response = requests.get(url)
parser = etree.HTMLParser()
root = etree.fromstring(response.content, parser=parser)
return int(root.xpath('count(//img[@src="pics/on.png"])'))
現在我很沮喪的是,在公會長在線的情況下,「on.png」會重複2次。 任何人都可以想辦法解決它嗎?這是HTML
<tr><td class='tabellatitolo a_dx' style=' padding:10px;' >Master
<td class='tabelladati' style=' padding:10px;' ><img align=absmiddle src='pics/on.png'>
<a href='?f=pg&id=55110'>Modernist</a>
<tr><td class='tabellatitolo a_dx' style=' padding:10px;' >Membri<p>(5)
<td class='tabelladati' style=' padding:10px;' >**<img align=absmiddle src='pics/on.png'>
<a href='?f=pg&id=55110'>**Modernist**</a>** - <br><img align=absmiddle src='pics/off.png'>
<a href='?f=pg&id=232720'>Human Slayer</a> - <i>Ti stimo!</i><br>
<img align=absmiddle src='pics/off.png'> <a href='?f=pg&id=68194'>Juggernaut</a><br>
<img align=absmiddle src='pics/off.png'> <a href='?f=pg&id=67121'>XeDiOr ThE KoOl</a><br>
<img align=absmiddle src='pics/on.png'> <a href='?f=pg&id=142638'>Lisbet Irmgard</a><br>
我想也許使用的上下文位置上或在「Membri」(成員)可能利用的一部分?
感謝任何暗示將appriciated :)
是的,我想看看使用「Membri」爲出發點,然後從那裏。它看起來像你提供的HTML是不完整的,所以很難說如何與你的結構完全一樣。 –