回答

2

是的,有工具可以將Apache Solr索引數據讀入Spark RDD對象,您可以將它們用於計算和報告目的。

這裏是一個工具,做此鏈接: https://github.com/lucidworks/spark-solr

+0

我理解是爲了這個,我需要我現有的Lucene索引轉換爲Solr的指標,即在寫一個Solr的schema.xml中在領域我的lucene索引,然後使用spark-solr連接器訪問它。但實際上,我的lucene索引具有大量字段,並且它們也會動態添加。因此,我打算保留我的lucene索引,並且爲了報告目的尋找解決方案..認爲火花將是一個很好的選擇,因爲後來它也可以方便機器學習..但不能找出一種方法將其與lucene集成.. – Sneha

+0

此外,我的lucene索引中的數據存儲在鍵值形式.. – Sneha