2012-06-21 54 views
1

我剛剛開始使用Nutch和Solr。我只用一個種子URL運行了一次抓取。 我跑這個命令:需要幫助理解Solr

bin/nutch crawl urls -dir crawl -solr http://localhost:8983/solr/ -depth 3 -topN 5

一切順利,我假設Solr的索引頁?那麼我現在怎麼去搜索呢?我就在這裏本地主機:8983/Solr的/管理/但是當我把搜索查詢,然後點擊搜索,我得到這樣的:

HTTP ERROR 400 
Problem accessing /solr/select/. 
Reason: undefined field text 

我也試圖從tutorial一個例子,但是當我運行此命令:

java -jar post.jar solr.xml monitor.xml

我得到這個:

SimplePostTool: version 1.4 
SimplePostTool: POSTing files to http://localhost:8983/solr/update.. 
SimplePostTool: POSTing file solr.xml 
SimplePostTool: FATAL: Solr returned an error #400 ERROR: [doc=SOLR1000] unknown field 'name' 

我的最終目標是要以某種方式將這些數據添加到Accumulo並將其用於搜索引擎。

回答

2

我假設你正在使用Nutch 1.4或更高版本。如果是這種情況,則需要將solr/conf/schema.xml文件中添加的字段的類型從「text」更改爲「text_general」,而不帶引號。

我正在努力實現類似的目標,並已使用該修復程序,至少可以使solr正常工作,但我仍然無法使用solr搜索索引站點。希望這有幫助,讓我知道如果你得到它的工作。