2016-12-05 37 views
0

我正在使用這樣的代碼來從pdf文件中刪除某些頁面。刪除帶有IText的PDF頁面導致每次輸出新的散列

PdfReader reader = new PdfReader(src); 
reader.selectPages("1,2"); 
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(dest)); 
stamper.close(); 

我的問題是,每次我運行此(同一輸入文件,頁面相同),輸出文件有不同的哈希值(使用MD = MessageDigest.getInstance(「SHA1」))

我需要的東西這樣

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

,但我得到這個

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_C) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_D) 

代碼

public String quitarPagBlancasPDF(String origen, String destino, int blankPdfsize) { 
     try { 

      com.itextpdf.text.pdf.PdfReader r = new com.itextpdf.text.pdf.PdfReader(origen); 
      String paginas = ""; 
      boolean editado = false; 

      for (int i = 1; i <= r.getNumberOfPages(); i++) { 
       byte bContent[] = r.getPageContent(i); 
       if (bContent.length > blankPdfsize) { 
        paginas += String.valueOf(i) + ","; 
       } else { 
        editado = true; 
       } 

      } 

      if (editado) { 
       r.selectPages(paginas); 
       PdfStamper stamper = new PdfStamper(r, new FileOutputStream(destino)); 
       stamper.setFullCompression(); 

       stamper.close(); 
       stamper = null; 
       r = null; 
      } else { 
       r = null; 

       return "Sin Cambios"; 
      } 
     } catch (Exception e) { 
      return e.getMessage(); 
     } 
     return "OK"; 
    } 
+0

Pdf包含有關上次更改文檔的日期和時間以及唯一ID的信息。這兩個因素都會導致不同的散列值。 – mkl

回答

0

Finalmentedecidí程序armar未散CON EL contenido德CADApágina德爾PDF對版本SI DOS PDF的兒子iguales

public static String getPdfSha(String origen, String metodo) { 
     try { 

      com.itextpdf.text.pdf.PdfReader r = new com.itextpdf.text.pdf.PdfReader(origen); 
      String Sha = ""; 

      for (int i = 1; i <= r.getNumberOfPages(); i++) { 
       byte bContent[] = r.getPageContent(i); 
       Sha = Sha + Arrays.toString(bContent); 
      } 
      Sha = encriptar(Sha, metodo); 
      return Sha; 

     } catch (Exception e) { 
      return ""; 
     } 
    } 

公共靜態字符串encriptar(字符串texto,字符串algoritmo){

String sha; 
try { 
    java.security.MessageDigest md = java.security.MessageDigest.getInstance(algoritmo); 
    byte[] hash = md.digest(texto.getBytes()); 
    java.util.Formatter formatter = new java.util.Formatter(); 
    for (byte b : hash) { 
     formatter.format("%02x", b); 
    } 
    sha = formatter.toString(); 
    formatter = null; 
    hash = null; 
    md = null; 

} catch (java.security.NoSuchAlgorithmException e) { 
    return ""; 

} 
return sha; 

}

+0

** A **英語,請。 ** B **你的散列現在只考慮即時頁面內容指示。這對你的任務真的夠嗎?除此之外,還有更多的pdf。 – mkl