我想湊英國食品評級機構數據ASPX SEACH結果頁面上scraperwiki(http://scraperwiki.com/scrapers/food_standards_agency/)使用機械化/ Python的,但拿出一個(E,G http://ratings.food.gov.uk/QuickSearch.aspx?q=po30)。問題當試圖按照其具有的形式是「下一個」頁面鏈接:Screenscaping ASPX與Python機械化 - JavaScript表單提交
<input type="submit" name="ctl00$ContentPlaceHolder1$uxResults$uxNext" value="Next >" id="ctl00_ContentPlaceHolder1_uxResults_uxNext" title="Next >" />
表單處理程序是這樣的:
<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm">
<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" />
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" />
<input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />
的HTTP跟蹤時,我手動點擊下一步鏈接顯示__e VENTTARGET爲空?我可以在其他刮板上找到的所有嬰兒牀都顯示__EVENTTARGET作爲處理下一頁的方式。
事實上,我不知道我要刮的頁面是如何加載下一頁的?無論我扔在刮板上,它只會加載第一個結果頁面。 (即使能夠改變每個頁面的結果數量也是有用的,但是我也看不出如何做到這一點)。
所以 - 關於如何刮取1 + N結果頁面的任何想法N> 0?