0
我最近遇到了由word2vec創建的單詞中的單詞/字符</s>
作爲單獨的單詞。來自word2vec的txt文件中的未知單詞/字符
雖然我確實試圖在網絡上搜索該字符,但我實際上無法在搜索引擎中指定該字符。
那麼,有沒有人知道這個角色是什麼?
我最近遇到了由word2vec創建的單詞中的單詞/字符</s>
作爲單獨的單詞。來自word2vec的txt文件中的未知單詞/字符
雖然我確實試圖在網絡上搜索該字符,但我實際上無法在搜索引擎中指定該字符。
那麼,有沒有人知道這個角色是什麼?
如果你看的word2vec
source code線82,
if (ch == '\n') {
strcpy(word, (char *)"</s>");
return;
}
</s>
僅僅是由Mikolov等人使用的字符。以表示行結束(或更準確地說是\n
)。 我不認爲它有任何特殊的HTML /乳膠引用。它也不出現在ASCII chart上。
它可能只是用來避免與正在訓練'word2vec'的文本中的單詞發生衝突。 – kampta