我正在編寫一個內部應用程序,該應用程序包含多條文本信息以及有關這些文本的若干條數據。這些數據片段將按照輸入順序保存在數據庫中(SQL Server,儘管可能會更改)。在C#中爲信息檢索應用程序編寫倒排索引
我希望能夠搜索這些信息中最相關的信息,其中最相關的信息將位於頂部。我最初研究使用SQL Server全文搜索,但它並不像我希望的那樣靈活,因此我似乎需要開發自己的解決方案。
根據我所理解的需要是inverted index,然後根據所保存的附加信息的結果來恢復和修改所述倒排索引的內容(儘管目前這可以在以後作爲我只是想倒排索引來索引數據庫表/字符串提供的主要文本)。
我在Java中使用Hashtable編寫代碼時出現了一個錯誤,使用鍵作爲單詞和值作爲單詞出現的列表的值,但在所有的誠實中,我仍然相當新,在C#和在處理信息時只使用DataSets和DataTables。如果有要求,我會在清除這款筆記本電腦後立即上傳Java代碼。
如果從表格或字符串列表中獲得一組條目,如何在C#中創建倒排索引,最好將其保存到DataSet/DataTable中?
編輯:我忘了提及,我已經嘗試過Lucene和Nutch,但是需要我自己的解決方案來修改Lucene來滿足我的需要需要比寫一個倒排索引要長得多的時間。我將處理大量的元數據,一旦基本倒排索引完成後也需要處理,所以我現在需要的是使用倒排索引在一個區域上進行基本的全文搜索。最後,在倒序索引上工作並不是我每天都要做的事情,所以對它進行破解會很棒。
這是另一種基於泛型的C#倒置索引:http://www.aleandmusic.com/InvertedIndex.aspx – 2011-06-01 22:29:14