2017-02-25 86 views
0

我有類似下面的代碼,重複X次Python的BeautifulSoup CSS選擇器

<div class="ABC">  
    <div class="DEF"> 
     <span class="GHI">{TEXT 1}</span> 
     <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a> 
    </div> 
    <div class="DEF"> 
     <span class="GHI">{TEXT 1}</span> 
     <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a> 
    </div> 
    ... 
</div> 
<div class="XYZ">  
    <div class="DEF"> 
     <span class="GHI">{TEXT 1}</span> 
     <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a> 
    </div> 
    <div class="DEF"> 
     <span class="GHI">{TEXT 1}</span> 
     <a href="#"><span class="{CLASS}">{TEXT 2}</span> {TEXT 3}</a> 
    </div> 
    ... 
</div> 

我怎麼會提取每個{TEXT 3}只有在父類是ABC?我有,我美化它,並得到行號,但不知道是否有一個更合適的方法

感謝

回答

0

像這樣的解決方案?

abc = soup.find('div', class_='ABC').find_all("div") 
for div in abc: 
    t3 = div.find('a').contents[1].strip() 
    print (t3) 

輸出:>>>{TEXT_3} * 2

+0

我需要{TEXT 3} – pee2pee

+0

對不起 - 固定:) – Zroq