2013-03-15 53 views
0

我即將推出Lucene.NET實現,我很擔心使用PorterStemFilter。在這裏閱讀,閱讀源代碼,看起來很遠,對我的需求太過激進。是否有KStem for .NET的端口?

我需要一些簡單的不尋找根,但只刪除「呃」,「ed」,「s」等後綴的東西。從我讀過的內容來看,KStem會做到這一點。

我不能爲我的生活找到一個.NET版本的KStem。我甚至找不到Java版本的源代碼來手動端口。

難道有人指着我正確的方向嗎?

看起來很簡單,只需簡單地刪除我不想要的步驟即可輕鬆地手工製作縮小的PorterStemmer。任何人都有成功嗎?

+1

KStem的java源文件可在以下網址找到:http://svn.apache.org/repos/asf/lucene/dev/trunk/lucene/analysis/common/src/java/org/apache/lucene/analysis/ en/ – 2013-03-18 18:01:59

+0

使用PorterStemmer和KStemmer進行比較的經驗? – Kevin 2013-03-19 14:47:46

回答

0

您可以使用HunspellStemmer作爲contrib的一部分。它可以使用免費的hunspell字典來提供適當的詞幹。