2017-05-25 76 views
0

我想通過密碼保護的網站登錄,以獲得訪問受保護的頁面,我有電子郵件和密碼名稱以及csrf-token.But當我嘗試訪問它不允許我保護的頁面,並將我重定向到登錄頁面。任何幫助都將非常棒!站點即時通訊設法訪問是。Python網絡報廢與登錄

https://www.usertesting.com/users/sign_in

import requests 
from lxml import html 

session_requests = requests.session() 

login_url = "https://www.usertesting.com/users/sign_in" 
result = session_requests.get(login_url) 

tree = html.fromstring(result.text) 
authenticity_token = list(set(tree.xpath("//meta[@name='csrf-token']/@content")))[0] 

userInfo = { 
    "user[email]": "email", 
    "user[password]": "password", 
    "csrf-token": authenticity_token 
} 

result = session_requests.post(
    login_url, 
    data = userInfo, 
    headers = dict(referer=login_url) 
) 

url = 'https://www.usertesting.com/my_dashboard' 

result = session_requests.get(
    url, 
    headers = dict(referer = url) 
) 

print result.content 
+0

如果你檢查後的數據,你會看到它超過3個輸入(6),你可能需要所有的tem。你也許必須在'headers'中包含'User-Agent'和'Referer' –

回答

0

嘗試採取看看這個https://kazuar.github.io/scraping-tutorial/您要尋找的答案。總結一下,你將需要檢查網頁,在你開始完整的抓取程序之前,你應該編寫另一個函數,輸入用戶名,密碼,然後進入網站。完成後,開始完整的腳本。

+0

那就是我遵循的教程... – user3808597

+0

啊,我明白了。執行後,print result.content會返回什麼? (我不是該網站的成員,所以我不能繼續前進測試 – Jeremy

+0

它返回登錄頁面的HTML,所以我想即時通訊重定向到該頁面 – user3808597