2015-07-10 101 views
-2

我有大約18個缺少文件(文件系統),我在intrenet上搜索到缺少文件系統的文章,請告訴我,如何去做。哪種方法我應該使用dataimport處理程序或solrJ?如何使用Apache索引對文件系統進行索引

+0

你真正想做什麼?索引18缺少什麼文件? – Prateek

+0

您好@prateek,我有一個fielsystems有18個lac文件,我想索引整個fielsystems使用solr.I有研究文件的solr,我找到了兩種方法我們可以索引文件系統DataImporthandler或Solrj –

+0

如果你已經通過solr文檔你會知道,對於solr文檔你需要有一個文檔ID。您需要了解數據的佈局並按摩它以符合解決方案的需求。 – Prateek

回答

0

請看看樣本數據配置文件在 http://wiki.apache.org/solr/DataImportHandler#FileListEntityProcessor

你需要使用類似XPathEntityProcessor定義 實體進行索引。如果您不使用XML文件,則可以使用其他實體處理器,例如 PlainTextEntityProcessor, 。另外,請確保 您的schema.xml中的字段定義與此處的字段名稱 匹配。

+0

謝謝你Godfrey,這完全是我的需求 –

+0

@godrey索引期間,我需要使用一些操作,如提取列,並進行一些操作,如添加一些東西。那麼,我將如何使用DIH進行吸吮操作。如果我將使用SolrJ,那麼我可以做任何事情,因爲我對Java有很好的瞭解。請幫我解決這個難題 在此先感謝 –