2014-09-23 52 views
1

我用solr正確設置了nutch 1.9。現在我想通過java將這些數據檢索到一個程序中,以分析和顯示數據。在他們那一刻,我可以用solr查詢數據。但是,我無法找到關於nutch使用的底層數據庫以及如何檢索數據的更多信息。Apache nutch 1.9數據庫

任何建議,如何做到這一點?

我很感謝您的回答!

回答

0

如果你可以看到你的數據已經索引在Solr中,那麼你不需要從Nutch中獲取任何東西。您現在需要的是正確的Solr客戶端與Solr進行交互。客戶端將查詢Solr並解析響應。

既然你要使用Java,你應該使用SolrJ

+0

也可以直接連接到nutch數據庫嗎?有沒有像jdbc連接? – mrquad 2014-09-24 13:16:23

+2

如果你想直接連接到Nutch,那麼你應該使用Nutch 2.x版本。它使用數據庫(MySql,HBase,Cassandra)作爲存儲引擎。因此,您可以查詢這些數據庫並獲取Nutch原始數據。但是,您爲什麼要訪問原始數據?我在這裏很car。。 – ameertawfik 2014-09-24 14:00:43

+0

Thx爲您的答案!我想解析html來檢索一些特定的字段,我想這是存儲在nutch中,還是我錯了? – mrquad 2014-09-24 19:09:57