0
我正在使用PyPDF2處理多個pdf文件,但我的腳本掛在某處。我在控制檯中看到的是一些「startxref與offset偏移量相同的行」,我正確的是一個警告,所以它仍然應該到finally塊並返回一個空字符串。PyPDF2掛起處理
我做錯了什麼?
import PyPDF2
import sys
import os
def decode_pdf(src_filename):
out_str=""
try:
f = open(str(src_filename), "rb")
read_pdf = PyPDF2.PdfFileReader(f)
number_of_pages = read_pdf.getNumPages()
for i in range(0,number_of_pages):
page = read_pdf.getPage(i)
out_str = out_str + " " + page.extractText()
out_str = ''.join(out_str.splitlines())
f.close()
except:
print("Exception on pdf")
print(sys.exc_info())
out_str = ""
finally:
return out_str
我不能複製任何錯誤,在這裏複製下面
通話功能轉換()相關的代碼。這段代碼對我來說工作得很好。你可以用你得到的確切錯誤更新你的文章嗎?這個錯誤只發生在大型PDF文件上嗎? –
無法用「某些錯誤」和「某個文件」重現。如果有一個文件始終產生這一個錯誤,請分享它,以便我們檢查。 – usr2564301