2011-03-05 82 views
5

我正在尋找執行Porter Stemmer algorithm相反的某種方式,即字符串「搜索」將返回一個數組「的搜索,搜索,搜索等。」Porter Stemmer算法的「相反」?

難道這樣的事情已經存在(在PREF PHP)?

謝謝你的幫助!

+0

「快樂」應該返回什麼?或「日」? – 2011-03-05 22:15:43

+0

只是我猜想的複數形式,雖然它會很好地做「幸福」等,這可能會涉及到做字典查找。 – Fred 2011-03-05 22:19:35

+0

你爲什麼想這樣做? – rik 2011-03-06 00:18:46

回答

1

我不確定這是否是您希望去的方向,但我會抓取一個字典詞彙文件(Mac和nix機器通常在/usr/share/dict/words有一個),並將其加載到一個易於搜索的存儲機制中。

接下來,我會編制suffixes的列表和rules applied to suffixes中的程序。

關於實際問題,我還沒有發現任何已經存在的東西。

+0

感謝您的鏈接,看起來像我將不得不建立自己的東西! :S – Fred 2011-03-06 11:24:43