2011-01-31 57 views

回答

0

就我所知,你基本上可以在Hive中編寫自定義的「行提取」代碼,所以我猜你可以。我從來沒有使用Lucene,幾乎沒有使用Hive,所以我不能確定。如果您發現問題的更確切答案,請發佈!

1

Hadapt是一家啓動了其軟件的Hadoop與SQL前端(如Hive)和混合存儲引擎。它們提供可滿足您需求的archival text search功能。

聲明:我爲Hadapt工作。

0

我知道這是一個相當老的帖子,但認爲我可以提供一個更好的選擇。

在你的情況下,不要將你的HDFS Lucene索引映射到配置單元模式,最好將它們推入豬,因爲豬可以讀取平面文件。除非你想用Relational方式來存儲數據,否則你可以通過Pig處理它們,並使用Hbase作爲數據庫。

0

您可以爲Hive編寫自定義輸入格式以訪問Hadoop中的lucene索引。