2013-02-28 53 views
-1

我正在處理大量文檔,並且具有一組預定義的類別/標記(可能是短語),這些預定義的類別/標記可能以精確或不精確的形式出現在文檔的文本中。 我想將每個文檔分配給最接近其文本的標籤中的一個標籤。使用預定義標籤標記文檔

請問我該怎麼做才能解決這個問題。

回答

-1

你可以看看在索引時標記文檔的lucene搜索引擎。 Northernlight搜索引擎用於執行您在搜索方法中提及的類似任務。你可以看看它的實現,以獲得一個想法。