藉助SAP HANA,您可以進行文本分析,全文搜索甚至情感分析。如何在SAP HANA全文搜索索引中自定義tokanization
在SAP HANA中定製託管的選項有哪些?
我知道我可以爲spezial單詞創建一個自定義字典。例如,我可以讓HANA將「堆棧溢出」識別爲單個實體/令牌。
但有時HANA會從多個不是一個令牌/實體的單詞中創建令牌,例如「SAP以經驗」在這裏我要2個令牌「SAP」和「體驗」(不是「SAP經驗)
所以你怎麼可以自定義tokanization(比自定義字典等)
藉助SAP HANA,您可以進行文本分析,全文搜索甚至情感分析。如何在SAP HANA全文搜索索引中自定義tokanization
在SAP HANA中定製託管的選項有哪些?
我知道我可以爲spezial單詞創建一個自定義字典。例如,我可以讓HANA將「堆棧溢出」識別爲單個實體/令牌。
但有時HANA會從多個不是一個令牌/實體的單詞中創建令牌,例如「SAP以經驗」在這裏我要2個令牌「SAP」和「體驗」(不是「SAP經驗)
所以你怎麼可以自定義tokanization(比自定義字典等)
我無意中發現這個信息和思想如果它有幫助,我會把它傳下去。
查看可用於定製HANA中文本索引的衆多參數。要查看全文索引的配置,請使用SYS.FULLTEXT_INDEXES視圖。你對PHRASE INDEX RATIO有什麼價值?