2014-10-10 63 views
1

下正確地處理我的pdftotext舊Linux版本(0.12.4),如果沒有問題,運行,但我想在Windows 7計算機上運行它。「pdftotext」錯誤 - 相同的PDF文件的Linux

我下載了Windows安裝程序,看起來是最新版本,xpdf-2.03-bin.exehttp://gnuwin32.sourceforge.net/packages/xpdf.htm

我接受所有的安裝程序默認值。當我運行Windows 7 pdftotext對Linux版本正確處理PDF文件時,我得到了下面的一系列錯誤消息:

- Error <0>: PDF file is damaged - attempting to reconstruct xref table ... 
- Error: Couldn't find trailer dictionary 
- List item Error: Couldn't read xref table 

我做了這些錯誤消息,網絡搜索,但沒有的問題,我發現與這些錯誤相關的似乎與我遇到的問題有關。

有沒有人遇到過這個問題,pdftotext在Windows 7或不知道如何解決這個問題?

+0

您的Windows版本'2.03'的pdftotext肯定是***不***最新版本。這個版本超過11歲。最新的Windows版本是'3.04',只有8個月大。 (你的Linux版本0.12.4'實際上比較新:它起源於5年前 - 但它基於提供Windows版本的代碼庫中的'fork')。 – 2015-01-13 19:34:07

回答

1

從版本號猜測:

  • 0.12.4在Linux上
  • 2.03在Windows

你似乎可以用兩個非常不同的東西,兩者都含有一個名爲pdftotext實用程序:

  • 版本0.12.4pdftotext一個poppler的基礎的版本,在2010年2月份被放開快5歲了,這是相當過時的今天。 poppler的是「叉」  從XPDF的原碼基礎,這發生在2005年由於叉發生了,它已經開發出比「媽媽」的代碼更快,並且已取得更多額外的+實用的功能。不過,很難爲Windows預編譯二進制文件。最新版本是0.30.0(2015年1月)。

  • 版本2.03pdftotextXPDF基礎的版本,在2003年十月發佈的,現在作爲超過11歲,這是。 XPDF是提供pdftotext實用程序的原始軟件。它於1995年首次發佈。儘管比Poppler叉更慢,它仍在開發中。其最新版本是版本3.04(2014年5月),可以是downloaded here。注意 - 可能會引起您的興趣:此版本包含一個新的文本提取器!