2012-04-05 59 views
2

我有一個問題,並不確定這是否可能,所以如果有人能指出我在正確的方向。Python文件下載

我需要從網頁打開一個文件,在Excel中打開它並保存文件。

我在網站上的文件名中遇到的問題有一個文件名(不是活動鏈接),然後它將有一個「下載」按鈕,不是特定於我需要下載的文件。所以,而不是下載按鈕是「file1todaysdate」,他們沒有什麼我可以使用的每一天。

有沒有一種方法可以找到文件名,然後從下載圖標抓取文件?然後保存在Excel中?如果不是爲浪費時間而感到遺憾。

回答

0

檢查響應的Content-Disposition標題以發現服務器希望您調用該文件的內容。

2

我想你在問什麼是如何搜索一些不是鏈接的文本的網頁,請求鏈接,保存文件。

BeautifulSoup通常用於此。

但是,requests是另一個庫,您可以使用它來獲取頁面,然後獲取內容以供日後分析。

2

當你按下載,文件實際來自哪裏?首先獲取該下載鏈接。如果很難從瀏覽器中檢測到,請使用像螢火蟲這樣的工具來獲取下載鏈接。一旦你得到它。您可以使用Python下載它使用urllib.urlretrieve

filename, msg = urllib.urlretrieve('http://yourlinktodownload/file.xls') 

文件名將指向已下載的文件。如果它是xls格式,它應該在excell中打開。