我正在開發一個項目,我需要從多頁PDF中提取每頁TIFF。 PDF只包含圖像,每頁有一個圖像(我相信它們是用某種複印機/掃描儀制作的,但沒有證實)。然後使用TIFF創建文檔的其他衍生版本,因此分辨率越高越好。來自PDF的高分辨率圖像
我發現兩個食譜,都有幫助的方面,但都不理想。希望有人能幫我調整其中一個,或者提供第三個選項。
配方1,pdfimages和ImageMagick的:
首先做的事:
$ pdfimages $MY_PDF.pdf foo"
導致幾個.pbm
文件(命名爲foo-000.pbm
,foo-001.pbm
)等
然後對於每個*.pbm
做:
$ convert $each -resize 3200x3200\> -quality 100 $new_name.tif
臨:得到的TIFF格式是在長尺寸的健康3300+像素,(調整大小隻是用來正常化的一切)
缺點:頁面的方向丟失,就出來旋轉不同的方向(他們遵循邏輯模式,所以他們可能是他們被送到掃描儀的方向?)。
配方2 ImageMagick的獨奏:
convert +adjoin $MY_PDF.pdf pages.tif
這給我的單頁TIFF(pages-0.tif
,pages-1.tif
,等等)。
專業:取向留!
Con:結果文件的長度是< 800像素,它太小而不實用,看起來好像應用了一些壓縮。
我該如何消除PDF中圖像流的縮放比例,但保留方向? ImageMagick中是否還有一些我失蹤的magick?還有其他的東西嗎?
你是否願意使用非免費的解決方案? – BitBank 2012-01-12 00:35:16
也許 - 它需要有一個API(沒有GUI)並且要合理地集成;我正在處理數以萬計的文檔。你有什麼考慮? – JStroop 2012-01-12 03:03:23
寫信給我的細節,我會看看我是否可以幫忙([email protected])。 – BitBank 2012-01-12 03:28:57