2012-04-05 51 views
0

我解析XML文件並提取「標題」,「ID」和從文件「文本」,並將它們存儲作爲對象。我有一個包含xml文件信息的對象集合。現在我想要將這些對象索引到solr中,以便我可以搜索相關文件。 有什麼辦法可以做到這一點? 需要幫助。索引類物體插入的solr

+0

您想使用哪種編程語言? – 2012-04-05 14:43:33

回答

1

你的存儲對象在哪裏?

您可以使用API(java,python,ruby,js,scala,perl,PHP甚至.NET)直接從您的源代碼發送數據到Solr。

不管的編程語言,你可以使用標準的HTTP POST推XML,CSV或JSON文件到Solr。
請參閱here以瞭解所有更新請求處理程序(誰處理您在Solr服務器上的請求)維基頁面。
here檢出(javaDoc)哪些類實現SolrRequestHandler。

如果您有某種可以返回XML的RESTfull服務或標準Web服務,您可以選擇使用DataImportHandler來從該源讀取。然後將它與XPathEntityProcessor結合使用,這將避免您必須手動解析XML。

無論您選擇何種方式,首先需要準備Solr schema.xml(添加標題,ID和文本字段),以便Solr知道如何索引數據。

而在此之前的所有,我建議你去通過Solr quick start tutorial