網絡爬蟲不斷說沒有屬性，即使它真的有

我一直在爲這個網站開發一個網絡爬蟲（http://www.bobaedream.co.kr/cyber/CyberCar.php?gubun=I&page=1）。但是我在抓取每個股票頭銜時遇到了麻煩。我很確定carinfo_title = carinfo.find_all（'a'，class _ ='title'）。網絡爬蟲不斷說沒有屬性，即使它真的有

請查看附件中的代碼和網站代碼，然後給我任何建議。

謝謝。

（網站代碼）

https://drive.google.com/open?id=0BxKswko3bYpuRV9seTZZT3REak0

（我的代碼）

from bs4 import BeautifulSoup 
import urllib.request 

target_url = "http://www.bobaedream.co.kr/cyber/CyberCar.php?gubun=I&page=1" 

def fetch_post_list(): 
    URL = target_url 
    res = urllib.request.urlopen(URL) 
    html = res.read() 
    soup = BeautifulSoup(html, 'html.parser') 
    table = soup.find('table', class_='cyber') 

    #Car Info and Link 
    carinfo = table.find_all('td', class_='carinfo') 
    carinfo_title = carinfo.find_all('a', class_='title') 

    print (carinfo_title) 

    return carinfo_title 

fetch_post_list()

來源

2016-12-26 신종원

你有多個元素與carinfo類，併爲每一個「carinfo」你需要去的汽車標題。環比table.find_all('td', class_='carinfo')結果：

for carinfo in table.find_all('td', class_='carinfo'): 
    carinfo_title = carinfo.find('a', class_='title') 
    print(carinfo_title.get_text())

將打印：

미니 쿠퍼 S JCW 
지프 랭글러 3.8 애니버서리 70주년 에디션 
... 
벤츠 뉴 SLK200 블루이피션시 
포르쉐 뉴 카이엔 4.8 GTS 
마쯔다 MPV 2.3

請注意，如果你只需要車的標題，可以將其簡化爲單一的線：

print([elm.get_text() for elm in soup.select('table.cyber td.carinfo a.title')])

其中.select()方法中的字符串是CSS selector。

來源

2016-12-26 05:12:42 alecxe

謝謝，我想通了！我感謝您的幫助。 –

網絡爬蟲不斷說沒有屬性，即使它真的有

回答

相關問題