2012-02-09 53 views

回答

0

一種方法是使用TermPositionVectors

您基本上會獲得每個查詢條件的職位,並按文檔中的相同順序計算他們在查詢中出現的次數。

+0

**非常感謝您的回覆! :)** 對不起,但它不適合,TermPositionVector拆分**字**。 String =「test bad word bad test bad bad bad」 TermPositionVector的回覆:{contents:bad/4,test/2,word/2} 我需要拆分短語**「bad word」**或**「糟糕的測試」**,這將是來自Lucene.Net的響應: 「壞詞」:「在文本中碰到兩次」 「壞測試」:「在文本中遇到過一次」 – 2012-02-10 07:52:02

+0

我知道TermPositionVector是用詞,但如果你有每個術語的位置,你當然可以找到並計算文檔中的短語。查看IndexesOf()和GetTermPositions()方法。我知道你可以做到這一點,因爲我過去做過,但我沒有可用的代碼發佈樣本。 – 2012-02-10 15:45:54

+0

**非常感謝,它幫助!** – 2012-02-10 20:57:29