我很新的蟒蛇,我試圖刮使用BeautifulSoup,這需要登錄的網頁。機械化不能登錄?
到目前爲止,我有
import mechanize
import cookielib
import requests
from bs4 import BeautifulSoup
# Browser
br = mechanize.Browser()
# Cookie Jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
br.open('URL')
#login form
br.select_form(nr=2)
br['email'] = 'EMAIL'
br['pass'] = 'PASS'
br.submit()
soup = BeautifulSoup(br.response().read(), "lxml")
with open("output1.html", "w") as file:
file.write(str(soup))
(用「網址」「EMAIL 「和」PASS「是網站,我的電子郵件和密碼。)
我在output1.html中獲得的頁面仍然是註銷頁面,而不是登錄後會看到的內容? 我該怎麼做才能使它登錄到詳細信息並在登錄後返回頁面上的內容?
乾杯的任何幫助!
難道不是'br.form ['email']'而不是'''email']'? –
這也行不通,我得到的結果仍然是沒有登錄的頁面。 –