2014-11-03 109 views
1

藉助SAP HANA,您可以進行文本分析,全文搜索甚至情感分析。如何在SAP HANA全文搜索索引中自定義tokanization

在SAP HANA中定製託管的選項有哪些?

我知道我可以爲spezial單詞創建一個自定義字典。例如,我可以讓HANA將「堆棧溢出」識別爲單個實體/令牌。

但有時HANA會從多個不是一個令牌/實體的單詞中創建令牌,例如「SAP以經驗」在這裏我要2個令牌「SAP」和「體驗」(不是「SAP經驗)

所以你怎麼可以自定義tokanization(比自定義字典等)

回答

0

我無意中發現這個信息和思想如果它有幫助,我會把它傳下去。

查看可用於定製HANA中文本索引的衆多參數。要查看全文索引的配置,請使用SYS.FULLTEXT_INDEXES視圖。你對PHRASE INDEX RATIO有什麼價值?

全部來源:http://help.sap.com/saphelp_hanaplatform/helpdata/en/cc/c504cebb571014badd88b622a24cae/content.htm?frameset=/en/f5/ceb3d471bf4ec0bf5a77351c1f035d/frameset.htm&current_toc=/en/fd/c71ac6a10b43cd97ff1bee7a3c3aab/plain.htm&node_id=21&show_children=false