2013-03-10 55 views
0

我有一個Hbase數據庫,用於保存wikipedia.org的已爬網信息。我的機器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行數據和Solr

我已經下載了Solr,然後我想在Hbase索引數據,然後我將搜索它。

我是Solr和Hbase的新手,我該怎麼做?

+1

如果您使用Nutch將數據抓取到hbase中,那麼您可以使用Solr和Nutch進行索引。請在這裏查看http://wiki.apache.org/nutch/CommandLineOptions – kich 2013-03-22 16:17:06

回答

0

所有你需要做的是,運行此命令 - sudo bin/nutch solrindex http://localhost:8983/solr/ -reindex

但在此之前,你這樣做,請確保您的Solr實例啓動並運行,您可以通過訪問此鏈接http://localhost:8983/solr/驗證,如果你能找到的Solr admin,那麼你的Solr實例正在運行。

+0

-reindex和-index有什麼區別? – kamaci 2013-09-20 12:14:07

+0

正如詞語所暗示的-reindex應該是對任何現有索引內容進行重新索引,並對任何新內容進行索引。 – sunskin 2013-10-07 19:30:49

+0

您還可以嘗試 - bin/nutch solrindex http:// localhost:8983/solr/-all – sunskin 2013-10-07 19:31:31