用python 3抓取多個網頁？

2017-06-15 135 views 1 likes

我得到了csv文件與衆多的網址。爲了方便起見，我將它讀入了一個熊貓數據框。以後我需要做一些統計工作 - 熊貓只是方便的。它看起來有點像這樣：用python 3抓取多個網頁？

import pandas as pd 
csv = [{"URLs" : "www.mercedes-benz.de", "electric" : 1}, {"URLs" : "www.audi.de", "electric" : 0}] 
df = pd.DataFrame(csv)

我的任務是檢查網站中包含特定字符串，如果是用1添加一個額外的列，和別的0。例如：我想檢查，其中包含字符串car。

import requests 
page_content = requests.get("www.mercedes-benz.de") 
if "car" in page_content.text: 
    print ('1') 
else: 
    print ('0')

我如何通過pd.URLs迭代/循環和存儲在數據框大熊貓的信息？

來源

2017-06-15 Rachel

回答

我覺得你DataFrame.iterrows需要通過數據環路，然後用loc創造新的價值：

for i, row in df.iterrows(): 
    page_content = requests.get(row['URLs']) 
    if "car" in page_content.text: 
     df.loc[i, 'car'] = '1' 
    else: 
     df.loc[i, 'car'] = '0' 

print (df) 
          URLs electric car 
0 http://www.mercedes-benz.de   1 1 
1   http://www.audi.de   0 1

來源

2017-06-15 11:48:56 jezrael

一個跟進：如果get請求失敗 - 例如當URL丟失或錯誤時，是否可以保持循環運行？ @jezrael – Rachel

對我來說很困難，但在python中注意了一些無聲的錯誤處理。我從不使用它，所以我不能給你一些好的建議。抱歉。如果仍然存在問題，也許嘗試其他問題 – jezrael

相關問題

1. 從網站抓取多個網頁
2. 使用python從網站抓取多個網頁
3. 從網站抓取多個網頁
4. Python的SSL網頁抓取
5. Xpath Python網頁抓取
6. Python - 網頁抓取數據表，覆蓋多個網址
7. 使用Python進行網頁抓取
8. Tripadvisor網頁抓取使用python
9. 使用Python無法抓取網頁
10. Selenium/Web抓取/網頁抓取Python中的應用程序
11. Python 3，網絡抓取和Javascript [Oh My]
12. 網頁抓取跨多頁rvest
13. 抓取整個網站python
14. Python網頁抓拍
15. Spyder - 網頁抓取
16. 在python下抓取IMDb的網頁
17. 在Python/R中的網頁抓取javascript
18. Python中動態網頁抓取
19. Python：從網頁抓取導出CSV
20. R/Python中的網頁抓取
21. 用Java抓取網頁
22. Beautifulsoup網頁抓取
23. PHP網頁抓取
24. 網頁抓取/抓取的資源
25. Python多線程網絡抓取
26. 刮屏|網頁抓取
27. 用selenium webdriver抓取多個網址
28. 從網頁抓取文本
29. 從網站抓取多個網頁（BeautifulSoup，Requests，Python3）
30. Python中的多線程網頁抓取/ PySide/PyQt

用python 3抓取多​​個網頁？

回答

相關問題

用python 3抓取多個網頁？