2010-08-20 61 views
1

我使用這些技術:SQL Server 2005中,ASP.NET MVC,NHibernate的/尖銳的架構,並想挖掘一些文字介紹與一些網頁的最終目的基於統計。我有幾百萬個關鍵字和幾百萬個文檔,並希望根據這些關鍵字索引的文檔運行一些查詢。我已經玩了一下SQL Server的全文索引,但我並沒有留下太深刻的印象。所以我想知道Lucene.Net是否可以替代。Lucene.Net,SQL服務器,NHibernate的,ASP.NET MVC

我從來沒有使用Lucene.Net卻明白,這是一個1:Java版本的1端口。所以我的第一個問題是,是否值得研究'Lucene在行動'這本書 - 前提是Lucene會是正確的'技術'?

謝謝。

最良好的祝願,

基督教

回答

4

好,

FIRST - 更新的SQL Server。您使用了兩代過時的版本,它們在SQL Server中首次實現全文搜索,並且有許多(已知和固定的)缺陷。

二 - Lucene的可能真的是更適合。 SQL主要是一個數據庫服務器,全文搜索可以做很多事情,但也有很多限制。

但進入Lucene的確實提供了顯著的併發症 - 分佈式事務處理備份轉複雜得多,因爲它們是兩個系統。 SQL 2008 R2在這裏做得更好(全文索引存儲在數據庫文件中)。

儘管如此,也小心的性能。如果要並行運行大量查詢(可以通過Web應用程序輕鬆完成),則可能需要一臺QUITE HIGH END SERVER。這可能需要多個數據庫服務器運行只讀複製 - 一些SQL Server比Lucene更容易(如:開箱即用)。

我建議你只是得到Lucene和它玩;)不更需要大量的。

+0

謝謝。我讀到2008年的sqls會好得多,但錢是問題所在。我可以得到開發者版本,但如果事情是基於網絡的許可證會花費很多。你認爲在lucene中討論的事情在行動(Java)幫助我處理lucene.net?這也是一個研究項目,所以我們不會期望成千上萬的「客戶」,所以只要查詢能夠在合理的時間內產生結果,我就很開心。 – cs0815 2010-08-20 07:48:28

+0

SQL Server 2008網絡版的每月處理器價格爲15美元/處理器。檢查蘇丹人民解放軍牌照 - 「高價」在這方面大多是「對蘇丹人民解放軍無能爲力」) – TomTom 2010-08-20 08:08:19

+0

聽起來很好,謝謝。你能回答書上的問題嗎? 「Lucene在行動」一書是否有用或者是否有其他充分的文件? lucene.net網站似乎沒有包含太多的文件... – cs0815 2010-08-20 08:24:59