2017-02-17 85 views

回答

1

只需發送Base64編碼的PDF在一個領域,如:

String base64; 
try (InputStream is = YourClass.class.getResourceAsStream(pathToYourFile)) { 
    byte bytes[] = IOUtils.toByteArray(is); 
    base64 = Base64.getEncoder().encodeToString(bytes); 
} 

IndexRequest indexRequest = new IndexRequest("index", "type", "id") 
    .setPipeline("foo") 
    .source(
     jsonBuilder().startObject() 
      .field("field", base64) 
     .endObject() 
    ); 

如果你沒有意識到這一點,我也鏈接到FSCrawler project的情況下,它解決了你想已經做一些事情。

0

這裏是你可以用它來索引PDF文件到ElasticSearch

  • 攝取附件插件
  • 的Apache提卡
  • FsCrawler
  • 安巴爾描述

優點/缺點四個選項this post

相關問題