我正在尋找像索爾一樣的搜索和替換功能。在Solr中搜索並替換?
我已經將文檔轉儲到solr中,並對其進行了一些文本分析。有時候我可能需要將幾個詞組合在一起,並希望solr把它當作一個單一的標記。
例如:「南非」將被視爲一個單一的令牌進行進一步處理。同時也注意到這些可以是動態的,並且即將讓最終用戶決定他/她必須分組哪些詞。所以NO語義是必需的。
我現在的計劃是在這兩個單詞之間添加一個特殊字符,所以Solr會將它視爲一個單一標記(StandardTokenizerFactory)以供進一步處理。
所以即時尋找類似:
replace("South Africa",South_Africa")
任何人都可以有什麼解決辦法?
我猜你需要共發現和其他的自然語言技術(詞性)「理解」令牌。我對可以理解單詞的過濾器感興趣(例如,在「IT經理」和「正在下雨」中區分「它」) – aitchnyu 2012-03-16 12:47:23