我在一個文件夾中擁有將近一千種pdf的期刊文章。我需要從整個文件夾中的文章中摘錄所有文章。現在我做了以下內容: dest <- "~/A1.pdf"
# set path to pdftotxt.exe and convert pdf to text
exe <- "C:/Program Files (x86)/xpdfbin-win-3.03/bin32/pdftotext.exe"
s
我的問題是,我有一堆的PDF文件,我想將它們轉換爲文本文件。其中一些是純粹的PDF,而其他的則是掃描頁面。我在Python中編寫程序,所以我使用pdftotext將它們轉換爲TXT。 我使用下面 filename = glob.glob(src) //src is my directory with my files
for file in filename:
subproc