如果您現在訪問this link,您可能會收到VBScript錯誤。我該如何刮這個框架?
另一方面,如果您訪問this link first和,然後上述鏈接(在同一會話中),頁面會通過。
這個應用程序設置的方式,第一頁是作爲第二(主)頁面中的框架。如果你點擊一下,你會看到它是如何工作的。
我的問題:我如何用Python刮第一頁?我試過了我能想到的所有東西 - urllib,urllib2,機械化 - 我得到的只有500個錯誤或超時。
我懷疑答案在於機械化,但是我的mechanize-fu不足以解決這個問題。誰能幫忙?
感覺需要編輯這個最優秀的答案,包括URL會話跟蹤以及cookie會話跟蹤。 – 2009-08-21 21:03:30
謝謝你把我推向正確的方向。你用cookie處理概述的方法是完全正確的解決方案,對我來說,答案是手動處理機械化cookie [如此處所述] [1]。 [Et瞧!] [2] [1] http://wwwsearch.sourceforge.net/mechanize/doc.html [2] http://twitter.com/humboldtCHP – hanksims 2009-08-22 06:24:33