2017-04-07 83 views
0

說我有兩個文檔向量,X1和X2。現在我用零矢量填充這些文件以使文檔長度最大限制。它會影響兩個向量之間的相似性嗎?或者總的來說它對我們有什麼幫助?填充對兩個向量的相似性的影響

回答

1

我可以回答第一部分。它不會影響向量之間的相似性。通常,在文檔處理中,將使用矢量之間的餘弦距離。通過加零,餘弦距離不會改變。通過添加零來增加維度。例如,在二維空間[1,2]和[3,4]是兩點。在三維中,相同的點表示爲[1,2,0]和[3,4,0]。儘管尺寸增加了,但點數保持不變。