2016-08-01 52 views
0

我最近遇到了由word2vec創建的單詞中的單詞/字符</s>作爲單獨的單詞。來自word2vec的txt文件中的未知單詞/字符

雖然我確實試圖在網絡上搜索該字符,但我實際上無法在搜索引擎中指定該字符。

那麼,有沒有人知道這個角色是什麼?

回答

1

如果你看的word2vecsource code線82,

if (ch == '\n') { 
    strcpy(word, (char *)"</s>"); 
    return; 
} 

</s>僅僅是由Mikolov等人使用的字符。以表示行結束(或更準確地說是\n)。 我不認爲它有任何特殊的HTML /乳膠引用。它也不出現在ASCII chart上。

+0

它可能只是用來避免與正在訓練'word2vec'的文本中的單詞發生衝突。 – kampta

相關問題