2013-04-23 138 views
1

查看this relatively old blogpost關於Cloudant's search featureCloudant搜索功能

一直在尋找解答一些疑問,因爲我們使用的Cloudant Heroku的附加組件&需要支持搜索查詢:

  • 是否有可能在基於Lucene的搜索索引存儲中CouchDB的本身,所以如果我們複製數據庫(例如,在移動設備上的Couchbase/CouchDB),那麼索引數據也會隨之而來?

  • 將對複製的CouchDB數據庫或僅在Cloudant上進行索引工作?

  • 如果我們將PDF作爲CouchDB文檔中的附件存儲,該怎麼辦?有沒有支持索引和搜索這樣的領域開箱即用?我們是否應該分析PDF的&編寫我們自己的分析儀,然後導入到Cloudant中?

  • 如果我們想要支持,最好的方法是什麼?如何搜索從Cloudant複製到移動設備上的本地CouchDB實例的CouchDB的PDF'附件'的內容?

如果有人能夠通過Cloudant提供一些實現這些指標的指針,那將會很棒。

我知道還有一些替代品,如CouchDB-Lucene,如here所述。

但是由於我們使用Cloudant作爲中央CouchDB,很想知道這是否可以輕鬆完成。

感謝

+0

請記住,Couchbase和CouchDB是2個不同的項目,你可以在這裏看到http://www.couchbase.com/couchbase-vs-couchdb – 2013-04-23 21:29:10

+0

是的,我知道。現在讓我們假設這是兩個地方的CouchDB。 (但事實是,我們在Cloudant上安裝了CouchDB,在Android設備上安裝了Couchbase-mobile)。 想知道如果我們必須在設備上使用類似[CouchDB-Lucene](http://rnewson.github.com/couchdb-lucene/)的東西?因爲這是我們需要搜索的地方? – fritz 2013-04-24 07:49:46

回答

3

是否可以存儲基於Lucene的搜索索引中的CouchDB的本身,所以,如果我們複製DB(比方說,一個Couchbase/CouchDB的移動設備上),那麼索引數據也隨之而來呢?

Cloudant上的搜索索引始終存儲在數據庫之外。與查看數據一樣,它們不會被複制。否則,我們不能使用Lucene高度優化的磁盤格式。對複製CouchDB的數據庫或者只在Cloudant

威爾索引工作?

搜索索引只能在Cloudant上使用(使用設計文檔中的「索引」字段)。您需要爲移動設備或複製的vanilla-CouchDB實例提供單獨的解決方案。

如果我們將PDF作爲CouchDB文檔中的附件存儲,該怎麼辦?有沒有支持索引和搜索這樣的領域開箱即用?我們是否應該分析PDF的&編寫我們自己的分析儀,然後導入到Cloudant中?

目前,您需要使用Tika之類的東西來解析PDF中的文本,並將其存儲在文檔中的字段中,然後通過搜索對其進行索引。自定義分析器不太可能得到支持,儘管支持索引二進制文件可能會在某個時刻到達。

如果我們希望支持,最好的方法是什麼?如何搜索從Cloudant複製到移動設備上的本地CouchDB實例的CouchDB的PDF'附件'的內容?

這取決於平臺。由於您已經解析了用於Cloudant搜索的PDF文本,因此您可以使用設備上的本地搜索API。不幸的是,到目前爲止,這些還有點薄弱,我還沒有時間爲自己嘗試。這是一個恥辱SearchKit尚未在iOS上提供,據我所知。

或者您可以使用Cloudant的搜索在線搜索,然後從本地數據庫中提取文檔,就像您擁有文檔ID一樣。