2016-01-21 94 views
-2

我相信這很容易,但我真的可以理解它。 我需要用python編寫腳本。該腳本必須採取的鏈接,並將其發送它http://archive.org/web/,更精確的腳本必須把這個鏈接,形成「現在保存頁面」:發送數據並得到響應

<form id='wwmform_save' name="wwmform_save" method="get" action="#" onsubmit="if (''==$('#web_save_url').val()){$('#web_save_url').attr('placeholder', 'enter a web address')} else {document.location.href='//web.archive.org/save/'+$('#web_save_url').val();} return false;" style="display:inline;"> 
       <input id='web_save_url' class="web_input web_text" type="text" name="url" placeholder="http://" /> 
       <button id='web_save_button' type="submit" class="web_button web_text">SAVE PAGE</button> 
      </form> 

,並得到一個實現鏈接。

我想使用「請求」庫,但不能解釋如何。 我應該先提出要求嗎? 我想我使用request.post,但我不知道我必須使用什麼參數。

編輯:

我不喜歡n1c9寫,它的話,節省的聯繫,但還需要我在那裏網頁保存的鏈接。當發送請求到http://web.archive.org/save/(link)時,它會加載幾秒鐘,然後重定向到所需的鏈接。

回答

1
url = 'urlyouwanttoarchive.com' 
archive = 'http://web.archive.org/save/' 
requests.get(archive + url) 

,如果你想要的網址到新存檔頁面:

print(archive + url) 

編輯:如果你有你想存檔的URL列表,這將工作太:

urls = ['url1.com','url2.com','url3.com','url4.com'] 
for i in urls: 
    requests.get(archive + i) 
+0

我查過了。它不會在web.archive.org上保存一個頁面。 – GiveItAwayNow

+0

我不知道該怎麼告訴你 - 它的確如此。 – n1c9

+0

n1c9,我在進入網站並檢查並且沒有保存的頁面後,用不同的鏈接運行您的代碼。 – GiveItAwayNow

相關問題