2013-03-14 62 views
0

我是Solr新手,我通過存儲在我的數據庫中的URL從二進制文件中提取元數據。我想知道哪些字段可用於從PDF索引(將以column =「」啓動的字段)。我也想知道如何在Solr中創建自定義字段。這是如何實現並映射到來自文件的特定元數據的。如果有人有一個代碼片段,可以告訴我,將不勝感激。 預先感謝您。Solr元數據索引

回答

0

要在Solr中創建自定義字段,您需要修改schema.xml文件以進行Solr安裝。隨分發包中包含的Solr示例(位於/ example文件夾下)附帶的schema.xml文件包含大量用於文件提取的預定義元數據字段。有關創建Solr中的自定義字段的信息,請參閱以下內容:

Solr中有一個內置的請求處理程序提取和二進制文件映射元數據。有關詳細信息,請引薦以下幾點:

+0

嗨佩奇,非常感謝您的回答。我希望能夠在不使用curl命令的情況下進行索引。我的代碼被設置爲動態索引。您能否給我舉一個例子,說明如何提取文件大小,格式或文件類型等內容?與這些類型的字段相關的列名將是什麼?此外,我想知道是否有一個如何映射自定義字段的代碼片段。我是否必須在solrconfig.xml中聲明它,或者在其他地方做一些調整? – Luis 2013-03-14 18:51:14

+0

有關代碼示例,請參閱Solr wiki中的此鏈接 - http://wiki.apache.org/solr/ContentStreamUpdateRequestExample至於列名稱,請參考示例並在schema.xml中相應地調整設置,使用上面的鏈接作爲參考。 – 2013-03-14 18:58:34