2010-05-04 36 views
1

我在一家新公司,我們的目標之一是爲我們的團隊和客戶實施文檔搜索門戶。我有點擔心,如果我們在雲中使用像Salesforce這樣的外部服務提供商或其他一些ECM,將來會有很多集成工作。從客戶角度來看,這些文檔與我們的結構化內容(存儲在數據庫中,而不是MS Word文檔)同樣存在。你用什麼語言,框架和技術來實現文檔搜索?

如果您已經實施了文檔搜索,您使用了哪些語言,框架和技術?你有沒有失敗的故事?使用開箱即用的功能我沒有任何問題,但是我認爲我們能夠控制文檔和訪問它們的API非常重要。如果我們完全自定義,我想使用Rails。

回答

2

根據您的許可需求,Lucene(LGPL)和Xapian(GPL)都是偉大的,成熟的,快速的搜索引擎API,它綁定了很多語言。我已經用它們兩個取得了巨大的成功。

+0

Lucene可能是文檔索引的OSS「標準」。 – BlackICE 2010-05-04 14:10:18

+0

好點。但我正在考慮更進一步,並使用Nuxeo或Alfresco作爲我們的後端公共存儲庫。我想我在想,如果這看起來像是矯枉過正,Lucene是更靈活的方式去。只是不想重新發明輪子... – 2010-05-04 14:37:58

1

Lucene可能是最安全的選擇,因爲它被廣泛使用和相當不錯。

從Lucene中受益的最簡單方法可能是Alfresco,安裝起來很輕鬆,默認情況下爲Lucene。這意味着您只需要安裝Alfresco,將您的文檔放入存儲庫,並且您可以使用強大的網頁搜索界面搜索您的文檔。

如果您需要以編程方式進行搜索,我的建議是使用Alfresco'CMIS接口,它允許您以REST方式進行搜索。 JCR API也可用。