沒有「內容」字段中創建使用Solr

索引PDF時，我有成功地索引PDF的使用POST命令，如下面的鏈接描述：存儲索引PDF文件中http://makble.com/how-to-extract-text-from-pdf-and-post-into-solr 沒有「內容」字段中創建使用Solr

條款可以查詢，並且可以使用被發現一般查詢或文字字段。

但是，我沒有看到「內容」字段的生成，因爲我可以與其他PDF相關的字段。我試圖編輯託管模式文件添加字段：

<field name="content" type="text_general" indexed="false" stored="true" multiValued="true"/> 

<copyField source="content" dest="text"/>

我收到以下錯誤，當我學嘗試重新加載核心：

<str name="msg">Error handling 'reload' action</str> 
<str name="trace"> 
org.apache.solr.common.SolrException: Error handling 'reload' action at org.apache.solr.handler.admin.CoreAdminOperation.lambda$static$2(CoreAdminOperation.java:110) at org.apache.solr.handler.admin.CoreAdminOperation.execute(CoreAdminOperation.java:370) at org.apache.solr.handler.admin.CoreAdminHandler$CallInfo.call(CoreAdminHandler.java:388) at org.apache.solr.handler.admin.CoreAdminHandler.handleRequestBody(CoreAdminHandler.java:174)

我solrconfig.xml中有這樣的：

<requestHandler name="/update/extract" 
        startup="lazy" 
        class="solr.extraction.ExtractingRequestHandler" > 
    <lst name="defaults"> 
     <str name="lowernames">true</str> 
     <str name="fmap.meta">ignored_</str> 
     <str name="fmap.content">_text_</str> 
    </lst> 
    </requestHandler>

我想有「內容」字段可用於執行搜索僅位於索引的PDF文件中的文本。

來源

2017-05-29 José Oliver-Didier

1）不要手動編輯架構文件。請使用Schema API。

2）fmap.content將content字段映射到您的案例中的_text_字段。如果您已經定義了content字段，那麼只需從ExtractingRequestHandler定義中刪除此特定參數即可完成此工作。

來源

2017-05-30 06:42:10

沒有「內容」字段中創建使用Solr

回答

相關問題