2015-04-22 65 views

回答

1

如果我理解正確的是<s></s>表示特殊(假的)對unigram作爲第一個和最後一個對unigram(實際上,前一和後,最後一個),每個文本,那麼在他們沒有必要對unigram,因爲任何字符串都包含這些unigrams,因此它們不提供其他信息。

這種特殊unigram進行可以在高階的n-gram情況下是有用的:例如,它允許從1個字的字符串中提取等hello 2雙字母組:<s> hellohello </s>或3個卦:<s0> <s1> hello<s1> hello </s1>hello </s1> </s0>