我有一個Hbase數據庫,用於保存wikipedia.org的已爬網信息。我的機器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行數據和Solr
我已經下載了Solr,然後我想在Hbase索引數據,然後我將搜索它。
我是Solr和Hbase的新手,我該怎麼做?
我有一個Hbase數據庫,用於保存wikipedia.org的已爬網信息。我的機器在Amazon Wweb Services。集成Hbase,其中包含Nutch爬行數據和Solr
我已經下載了Solr,然後我想在Hbase索引數據,然後我將搜索它。
我是Solr和Hbase的新手,我該怎麼做?
所有你需要做的是,運行此命令 - sudo bin/nutch solrindex http://localhost:8983/solr/ -reindex
但在此之前,你這樣做,請確保您的Solr實例啓動並運行,您可以通過訪問此鏈接http://localhost:8983/solr/
驗證,如果你能找到的Solr admin,那麼你的Solr實例正在運行。
如果您使用Nutch將數據抓取到hbase中,那麼您可以使用Solr和Nutch進行索引。請在這裏查看http://wiki.apache.org/nutch/CommandLineOptions – kich 2013-03-22 16:17:06