2017-02-13 98 views
0

嘗試讀取URL列表,然後在課堂上輸出html。它的作品,但只爲列表中的最後一個網址,我似乎無法弄清楚爲什麼。我設置了超時等,但它仍然只是返回和空的響應,除了最後一個網址。Python從文件中讀取URL只會獲取最後一個URL

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

from bs4 import BeautifulSoup 

import requests 
import time 

with open('/Users/usrname/Desktop/links.txt') as f: 
    for line in f: 
     print(line) 
     html_doc = requests.get(line, verify=False, timeout=2) 
     soup = BeautifulSoup(html_doc.text, 'html.parser') 
     #time.sleep(1.3) # seconds   
     print (soup.find_all("div", "location-content"))   

回答

3

該文件的最後一行沒有回車,而其他行沒有回車,而其他行都不是有效的URL。你需要剝離回車帶rstrip()

for line in f: 
    line = line.rstrip() 
+0

完美..乾杯 – Kravitz

+0

不客氣! –