我想實現文本搜索引擎。特別是要索引的文件將是重量條款清單。
該查詢是一個簡單的術語列表。
搜索的輸出應該是按照相關性匹配的排序列表(針對條款及其權重) 我需要存儲的數據很大!它不適合單個節點。所以最終的存儲必須易於分發。Couchbase或Riak作爲搜索引擎的數據存儲
您會推薦哪種數據庫存儲? 經過一些分析,我想選擇Couchbase和Riak。
你對簡單的關係型數據庫有什麼看法?他們已經有一些很好的發佈機制(例如:Postgres 9內置)
Riak具有buildin搜索功能,但據我所知我不想使用它,因爲我需要有索引來獲得響應(而不是爲每個查詢計算)。
在另一方面Couchbase 2「增加了二級指標爲JSON文件。通過則可以查詢該視圖創建索引。索引是均勻分佈的。」
這聽起來作爲Couchbase
更多細節兩個數據塊使用隊列自己的同步等Stack Overflow是不是一個推薦引擎(HTTP://元。 stackexchange.com/a/128562/172496) – 2012-04-25 06:03:52
那麼我應該在哪裏尋找建議,如果我沒有與沙發底座或riak專業? – 2012-04-25 11:50:59
對於文本搜索考慮Solr(成熟但很難碎片)或彈性搜索(旨在自動分片)。然後,在CouchDB,Riak或其他NoSQL DB中進行Lucene(like)集成以進行文本搜索。特別:Sphinx全文存儲用於MySQL或其他文本搜索-RDBMS集成。 – aitchnyu 2012-04-26 06:41:52