這段代碼有什麼問題?我嘗試使用Python 3.4登錄到ISP客戶端頁面,並返回相同的HTML頁面。使用python登錄網站
import urllib.request
import urllib.parse
from http import cookiejar
from bs4 import BeautifulSoup
url = "https://www.exampe.com/login.php"
name = "username"
passw = "password"
def Login():
cj = cookiejar.CookieJar()
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = { 'User-Agent' : user_agent }
redirect =urllib.request.HTTPRedirectHandler()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
values = {'unam' : name, 'pass' : passw}
data = urllib.parse.urlencode(values)
binary_data = data.encode('utf-8')
login = urllib.request.Request(url,binary_data,headers)
login_response = opener.open(login)
soup = BeautifulSoup(login_response.read(),'lxml')
print(soup)
Login()
有很多原因可能無法正常工作。你應該調查更多你的ISP頁面,並檢查是否沒有一些隱藏的字段或其他保護措施,這種方式登錄。 – 2014-09-25 19:19:35
它不僅適用於ISP頁面,也適用於其他網頁。 – 2014-09-26 06:46:40
任何建議..? – 2014-09-26 13:10:46