2015-10-15 147 views
2

這不是重複的,儘管在2011年的論壇中已經提出了這個問題Getting a hyperlink URL from an Excel document,2013 Extracting Hyperlinks From Excel (.xlsx) with Python和2014 Getting the URL from Excel Sheet Hyper links in Python with xlrd;仍然沒有答案。 在深入瞭解xlrd模塊後,似乎Data_sheet.hyperlink_map.get((row,col))項會跳出,因爲「xlrd無法讀取超鏈接,而不使用formatting_info,目前xlsx不支持該超鏈接」每@alecxe位於Extracting Hyperlinks From Excel (.xlsx) with Python 。 問題:有沒有人從存儲在excel文件中的超鏈接中提取URL。說,在所有的客戶數據中,都有一列超鏈接。我正在將Excel表格轉儲爲html頁面,然後按照慣常的方式進行抓取(本地驅動器上的文件)。但這不是一個生產解決方案。補充:是否有任何其他模塊可以從超鏈接單元格上的.cell(row,col).value()調用中提取url。機械化有沒有解決方案?非常感謝。如何讓XLRD在XLSX單元格中讀取超鏈接?

+0

也很想認識我自己。 –

回答

0

我有同樣的問題試圖從一個xlsx文件的單元格獲取超鏈接。我想到的工作只是將Excel工作表轉換爲xls格式,從中我可以設法解決超鏈接問題,一旦編輯完成,我將其格式化回原始的xlsx文件。

我不知道這是否適合您的具體需求,或者格式的變化是否意味着某些我不知道的連貫性,但我認爲這值得一試。

相關問題