2011-09-18 71 views
1

我正在尋找一個庫,我可以在C#Windows應用程序中使用比較PDF文件。我已經看到了很多用於進行頁面式pdf比較的工具(例如,http://www.inetsoftware.de/other-products/pdf-content-comparer)。不過,我想要內容明智的比較。這意味着如果添加或刪除的內容會導致改變後的所有內容都被吹噓,那麼我不希望將改變後的內容視爲已更改。內容明智而不是頁面明智的PDF比較庫

一種選擇是從pdf文件中提取文本,然後使用類似Eugene W. Myers在他的論文「An O(ND)差分算法及其變體」中提出的算法進行文本比較。但是,我想知道是否有可以在C#中使用的工具或庫來執行此操作?理想情況下,該工具將顯示整個原始文檔並突出顯示更改。該工具還將檢測其他內容更改,如圖像更改。

謝謝。

+0

你需要的是精確的,而對於一個圖書館。如果你想要一個應用程序或GUI組件,那我可以理解,但一個庫有點多。你確定你在問正確的事嗎? – ArtB

回答

2

商業選項是DocsCorp compareDocs SDK(也稱爲DocuComp)http://www.docscorp.com/public/products/publicProductsDocuCompServer.cfm

它是一個基於內容的比較溶液。例如,由於插入新段落而導致的內容轉移不會導致所有後續文本被視爲「更改」。插入的段落將被標記爲「插入」,而後續文本仍將被視爲「相同」。

PDF與PDF作爲單個PDF輸出的比較。更改顯示爲註釋(插入顯示爲帶下劃線的文本,刪除由固定到刪除點的PDF註釋(黃色便籤)表示。輸出可以是一個說明更改的PDF。這是基於修改後的PDF,或者它可以在一個PDF中顯示代表兩個PDF的並排視圖。

該比較僅基於文本。它目前不試圖在PDF中顯示圖像或其他圖形元素的更改。

爲了充分披露,我被僱用並且部分擁有這家公司。我的位置是R & D VP。

問候 巴蒂爾