2010-02-21 200 views
6

我正在構建企業網站的過程中。我們正在尋找任何基於ASP.NET的開源或付費搜索引擎。它應該能夠在網站的所有網頁的ASP.NET搜索引擎

  1. 搜索網頁內容。
  2. 所有辦公文件。等等
  3. 如果我們有一些searach重新篩選基於用戶類型和樣式。

請讓我知道我們需要考慮什麼樣的工具或軟件。

回答

7

嘗試Lucene.NET

Apache Lucene是一個高性能, 全功能的文本搜索引擎 庫完全用Java編寫。它 是一種適用於接近 任何需要 全文搜索,尤其是 跨平臺的應用程序。

Lucene.Net是一個源代碼, 級每級,API的每API和Java Lucene的 搜索引擎的 algorithmatic端口到C#和.NET平臺 使用的Microsoft .NET框架 。

這裏有教程的一些鏈接,讓你開始:

2

Solr的是另一個不錯的選擇,它有效地頂上的門面lucene爲您提供了一個很好的基於REST/url的API。有一個可用的,成熟的.Net庫也可以使用它。

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

從你的問題,雖然,你在尋找實際的底層引擎或者是你尋找的東西也抓取/遍歷您的內容建立您選擇的搜索引擎的索引?

-

編輯回覆從原來的海報發表評論。

你有兩個等式解決然後。

首先是挑選一個搜索引擎,迴應輸入(關鍵字),然後查詢其索引,並回報它認爲是相關匹配。等式的後半部分是找到一種機制來填充所選引擎的搜索索引。就引擎而言,Lucene已經被提出,並且我提出了一個Lucene的變體,它提供了一個(可以說是)改進的開發接口。就構建搜索語料庫而言,這有點不同。在這裏,您可以選擇編寫自己的軟件來獲取一段內容並將其添加到索引中。這裏的優勢是你對搜索引擎和什麼時候進行了很好的控制。不好的一面是你正在編寫新代碼 - 幸運的是像Lucene/Solr這樣的現代搜索引擎使它變得非常簡單。

您的第二個選擇是使用某些內容自動抓取您的內容並將其添加到索引。這裏的問題在於識別和學習配置適當的選項。根據您選擇的抓取工具,它可能會或可能不會很好地對文件系統中的文檔建立索引(如在企業Sharepoint站點中說的)。

Nutch是來自Apache(Lucene和Solr的製造商)的爬蟲,如果您選擇不寫自己的代碼,可能會使用它。 http://wiki.apache.org/nutch/

+0

我們正在建設一個企業網站。任何訪問該網站的人都應該能夠搜索所有網頁內容。 – user171523 2010-02-21 21:29:58