2011-02-10 50 views
2

我在lucene中使用搜索系統。默認情況下它不是分佈式的,所以我正在考慮轉向像HBase或Hadoop這樣的東西。HBase vs Hyptertable VS Lucene

HBase或Hypertable等解決方案是否具有內置搜索功能,還是需要在其上實現Lucene?

回答

5

Lucene與BigTable克隆如HBase或Hypertable非常不同。如果您只是尋找分佈式Lucene,那麼您應該查看諸如Elastic Search或Katta之類的項目。

Solr/Lucene也可以在羣集上運行,但分區不是自動的。您必須手動創建分片和副本以匹配您正在查找的數據分佈。如果您的底層數據存儲在像HBase這樣的東西中,則設置,修改和更新起來要容易得多。

HBase和Lucene從根本上解決了不同的問題。 Lucene是一個索引,允許關鍵字和其他類型的搜索快速返回。 HBase是一個數據存儲庫,可以實時提供單個行;然而,HBase沒有在線查詢功能。爲了獲得最佳效果,你必須將它們結合起來。在這方面的一個例子是莉莉(http://outerthought.org/site/products/lily.html

+0

與SolrCloud被改變了:你必須手動創建碎片和副本,以配合這些數據您正在尋找 – kamaci 2013-04-21 23:03:26

0

Lucene提供兩個主要特點:結構化搜索和全文本搜索。 Hbase沒有提供任何這些,結構化的搜索可以用一種相對簡單的方式用hbase完成,這正是禮來的想法。但重建全文搜索會更困難。要擴展您的Lucene,您仍然可以嘗試通過查看可以將數據分割爲單獨區域的屬性(您將無法進行跨區域搜索)來對索引進行分區。然後你可以爲每個區域創建一個羣集。

1

的另一項技術看是凱塔或分佈式Lucene的可HDFS上操作