2011-10-13 42 views
0

the wikipedia page,它說,使用獨特的終止字符串$0$1,...,$n-1的樹n字符串,s1,... sn填充廣義後綴樹和實施資源

我的問題是:如何處理字符串i+1的文字後綴$i的情況?例如,我的第一個字符串s1example$0。這樣做的聰明方式是什麼?

另外,我發現的後綴樹的實現大多爲單個字符串,而不是廣義版本。給定單個字符串的實現,如何輕鬆擴展它?

謝謝!

回答

0

第一個問題:如果您使用的是Unicode,則可以使用未在您的環境中分配的PUA代碼(http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Private_use_characters)。從U + E000開始可以。如果您使用的是8位ASCII碼,請使用您知道不在字符串中的字節碼 - \ 003(文本結尾)聽起來合適 - 而不是'$'。

第二個問題:重新開始,只能從當前樹而不是空的樹開始。獨特的終結者保證你永遠不會發現自己試圖分裂葉節點。