我正在嘗試發送一些json請求來刮取像這樣的無限滾動框link。它的JSON鏈接:在Python中發送json請求
一些參數不neccesary和我創建的有效參數的字典。例如,參數Count是每個滾動中顯示的項目數。我的代碼是:
import json
import requests
parameters = {'countryCode':'US','dateTime':'', 'docId':'','sequence':'6e09aca3-7207-446e-bb8a-db1a4ea6545c',
'messageNumber':'1826','count':'10','channelName':'', 'topic':'_:1479366266513' }
data = json.dumps(parameters)
firstUrl = "http://www.marketwatch.com/investing/stock/xom"
html = requests.post(firstUrl, params = data).text
我的問題是,根據參數我不能發送請求,如果我刪除了所有的參數,我得到相同的頁面(firstUrl鏈接),如果我包括所有的人。你有什麼想法爲什麼會發生,我怎樣才能解決這個問題?
我想,要報廢無法通過單個請求(即使您指定'數:1000')接收的內容,因爲每個你再拍滾動的時候,您的瀏覽器發送新的'XHR'請求爲另一個(10項)數據。 – Andersson
謝謝安德森,我的問題是,即使沒有定義任何參數,我得到的是相同的結果,這是主頁,而不是我感興趣的容器(有3個不同的無限滾動框,我對其中的一個),我給出了該特定元素的參數,但它無法檢測到它。 –