2013-04-24 60 views
0

我有PDF文件,主要是舊報紙頁面的大圖像。使用gs 9.06這些被正確渲染,但在我的網站上(使用ghostscript 8.70),它們以嘈雜的灰色背景顯示。下面的鏈接提供了一個示例(從下載GS單頁):ghostscript 8.7顯示嘈雜的灰色背景

http://mvtm.ca/collections/php/serve_pdfpage.php?file=1940-04-11&page=01

實際GS命令是: GS -q -sDEVICE = pdfwrite -r200 -dNOPAUSE -dBATCH -dSAFER -dFirstPage = 01 -dLastPage = 01 -sOutputFile = -mypdffile.pdf

看起來,圖像層(唯一應該呈現的東西)沒有顯示出來。這些pdf也由OCR程序處理以添加用於搜索的背景文本。

此確切程序在我的本地計算機(Mac OS X)上正常運行。

有沒有人知道這裏發生了什麼?

回答

0

我不完全確定你所看到的是一個問題。你說使用最新版本的Ghostscript「正常」工作,並使用舊版本不?

這只是暗示我在過去的四年裏某個bug已經被修復了。在我看來,你應該升級你的8.70安裝。

請注意,雖然沒有什麼可以通過查看破損的輸出來說明的,但我需要在破解之前看到原始文件,以便猜測該錯誤是什麼。

隔離我的猜測是原始文件使用JBIG2或JPX編碼的圖像作爲背景,而且我們的JBIG2解碼器有一個bug(少數已被修復),或者在JPX認爲JasPER解碼器存在缺陷。我們停止使用JasPER,因爲它速度慢,內存不足,錯誤纏身並且實際上不受支持,而是轉而使用OpenJPEG。

但也許我錯過了你的觀點。

0

我不確定你來自哪裏或你要去哪裏。您提取一頁PDF文件並輸出另一個PDF文件,但鏈接爲.png。看到輸入和中間值可能會有所幫助.pdf

我看到的是單色位圖。您可以添加-dProcessColorModel =/DeviceGray或-dProcessColorModel =/DeviceRGB,這樣可以使輸出的pdf具有色調,而不僅僅是黑白。

另一種可能性是添加變換曲線,該變換曲線會減輕背景,同時使黑色變暗,但似乎還有其他事情發生。輸出中的標題似乎缺少字母。即使灰度和更好的黑白對比,其他事情似乎也在發生。