2017-03-01 68 views
-1

我很好奇PDF保護工作如何?我可以鎖定PDF文件,因此係統無法識別文本並使用PDF文件進行操作。我發現的一切都是關於「如何鎖定/解鎖」,但沒有任何關於「它是如何工作的」。有沒有人可以向我解釋? THXPDF保護如何工作?

+0

這是一個非常廣泛的問題。 PDF可以具有任何數量的可以基於標準或專有的加密算法,這些加密算法需要Adobe Reader的插件。你將需要更具體。 – joelgeraci

+0

@joelgeraci對不起,不具體。我的意思是鎖定文本識別或PDF文件操作。密碼學不應該只是一些竅門。 – Majzlik

+0

如果文件可以打印或者甚至可以查看,那麼您可能根本沒有任何安全保護......打印並掃描或拍攝屏幕,OCR的圖片,並獲得文本。 – joelgeraci

回答

1

的OP澄清評論

我的意思是鎖定文本識別或操縱與PDF文件。密碼學不應該只是一些竅門。

還有一些選項,其中包括:

  • 可以呈現文本爲位圖和包括位圖的PDF

    - >沒有文字信息。

  • 或者你可以嵌入使用非標準編碼有問題的字體,而無需使用標準字形名

    - 未知編碼>文本信息。

    E.g.比照在this answer分析PDF。

    一個特殊情況:使編碼錯誤只有幾個字符,也許只有一個,可能是一個數字。這樣一個沒有資格的人認爲一切都被提取出來了,只有當數據被使用時,錯誤纔會開始搞砸,特別是在數字錯誤的情況下很難解決。例如。比照在this answer中分析的PDF。

  • 或者你可以把結構文本,其中文本提取軟件或複製粘貼&通常套路不看,就像創建包含一段文字框中的內容大圖案瓷磚和填充與匹配模式的顏色區域。

    - >文本信息存在但大多數提取器都看不到。

    E.g.比照this answer;這裏的技術用於使水印文本不可提取。或者你可以在頁面上放置額外的文本,但是使其不可見,例如,在呈現模式3(不可見)下繪製的圖像下,位於某些禁用的可選內容組(層)中,...文本提取器通常不檢查它們實際提取的文本是否可見。

    - >文本信息存在,但被垃圾文本位污染。

  • ...