2017-08-12 74 views
0

我在Solr的開發環境新,並具有以下data_config文件:如何在solr中存儲和索引文件名?

dataConfig> 
<dataSource type="BinFileDataSource" /> 
    <document> 
     <entity name="files" dataSource="null" rootEntity="false" 
     processor="FileListEntityProcessor" 
     baseDir="/home/shah/solr/TestIndex" fileName="\.(txt)|(pdf)|(docx)" 
     onError="skip" 
     recursive="true"> 
      <field column="fileAbsolutePath" name="id" /> 
      <field column="fileSize" name="size" /> 
      <field column="fileLastModified" name="lastModified" /> 

      <entity 
       name="documentImport" 
       processor="TikaEntityProcessor" 
       url="${files.fileAbsolutePath}" 
       format="text"> 
       <field column="file" name="fileName"/> 

      </entity> 
    </entity> 
    </document> 

我已經包括上述領域在我的schema.xml爲:

還包括相應地在solrconfig文件中導入處理程序。

我有10個文本文件即1abc.txt,2B.txt ......... 10B.txt,我想存儲在一個字段文件名這些文件的名稱上面decleared:

時我執行導入處理程序,其工作良好,但fileName字段爲空。

在這方面的幫助將不勝感激。

+0

非常感謝我解決了上述問題///它非常簡單,只需將文件名字段放入FileListEntityProcessor中即可。它會索引文件名 –

回答