2017-07-19 106 views
-1

我有以下的HTML,我需要獲取標記的內容:我儘量選擇「禮」與Beautifulsoup:不能選擇孩子

<li class="tag"> 
    <a class="remove-tag" href="#"> 
     <i class="delete-tag" title="Delete"></i> 
    </a> 
    <a href="#">Nature</a> 
</li> 

第一:在這種情況下,即「自然」 'tag'類。

soup.findAll("all", {"class": "tag"}) 

如何獲取標籤的內容:a?

+0

內容:一個?你的意思是標籤? –

回答

0

如果你做了一個findAll湯,它會發現不需要遍歷。

soup.findAll("a", {"class": "classname"}) 
0

你想soup.findAll("li", {"class": "tag"})[0].a,那就是:

<a class="remove-tag" href="#"> 
<i class="delete-tag" title="Delete"></i> 
</a> 
2

您可以使用CSS選擇器,你可能很熟悉。

>>> soup.select_one("li.tag a:nth-of-type(2)").text 
u'Nature' 
+1

好吧,他們中的一些無論如何:) – pguardiario

0

希望這有助於!

lis = soup.find_all('li', class_='tag') 
data_rows=lis.findAll('a') 
data=[data_rows[i].getText() for i in range(len(data_rows))] 



不要忘了讓我們知道是否能解決你的問題:)標籤