使用Lucene處理同義詞(短語)的最佳方法是什麼? 特別是,當我需要執行如下查詢:a或b或c NOT d使用Lucene的同義詞
如何在索引時向每個文檔添加名爲「synonyms」的新字段? 該字段的值將包含所有同義詞的列表。只有當該文檔具有任何同義詞時,纔會將其添加到文檔中。
然後,我會執行一個「OR」搜索查詢,該查詢將在該字段中搜索關鍵字以及其他字段。
這種方法可以適用於任何類型的查詢嗎?
僅供參考, 在我的應用程序中的同義詞是完全自定義的,而不是從英語詞典...即。 「全球金融領袖」也可以是「頂級投資銀行」或「財富500強財務公司」等。
請建議。
謝謝。
感謝您的投入亞當...你可以請再次參考我的問題嗎?我現在編輯它。 – 2009-08-09 15:59:22
WordNet模塊就像您一樣構建Lucene索引。它構建的這個索引最終用於擴展查詢。如果您只是簡單地嘗試從WordNet的詞典構建這個索引,我相信您可以很容易地知道它用於索引的字段名稱,並自己添加您自己的自定義條目。 – 2009-08-09 17:57:07